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La presente invention a pour objet des fragments d'ADN de Neisseria 
meningitidis codant pour les sous-unites du recepteur de la transferrin ainsi 
qu'un pro.cede de fabrication de chacune des sous-unites par voie 
recornbinante. 

D'une maniere generate, les m6ningites sont soit d'origine virale, soit 
d'origine bactdrienne. Les bactdries principalement responsables sont : N. 
meningitidis et Haemophilus influenzae, respectivement impliquees dans 
environ 40 et 50 % des cas de meningites bacteriennes. 

On denombre en France, environ 600 a 800 cas par an de meningites a 
■N. meningitidis. Aux Etats-Unis, le nombre de cas s'eieve a environ 2 500 a 3 
000 par an. 

L'espece N. meningitidis est subdivisee en serogroupes selon la nature 
des polysaccharides capsulaires. Bien qu'il existe une douzaine de 
serogroupes, 90 % des cas de meningites sont attribuables a 3 serogroupes : 
A, B et C. ! 

n exisfe des vaccins efficaces a base de polysaccharides capsulaires .... 

pour prevenir les meningites a meningitidis serogroupes A et C Ces 
polysaccharides tels quels ne sont que peu ou pas immunogeniques chez les 
enfants de moins de 2 ans et n'induisent pas de memoire irnmunitaire. 
Toutefois, ces inconv6nients peuvent etre surmontes en conjuguant ces 
25 polysaccharides a une proteine porteuse. 

Par contre, le polysaccharide de N. meningitidis groupe B n'est pas ou 
peu immunogene chez l'homme, qu'il soit sous forme conjuguee ou non. 
Ainsi, il apparait hautement souhaitable de rechercher un vaccin a l'encontre 
des meningites induites par AT. meningitidis notamment du serogroupe B 
autre qu'un vaccin a. base de polysaccharide. 



20 



30 



A ceite fin, differentes proteines de la membrane externe de M. 
meningitidis ont deja ete proposees. H s'agit en particulier du recepteur 
3 5 membranaire de la transferrine humaine. 
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D'une maniere generate, la grands majorite des bacteries ont besoin 
de fer pour leur croissance et elles ont developpe des systemes speciSques 
d'acquisition de ce metal. En ce qui concenie notamment M meningitidis qui 
est un pathogene strict de l'homme, le fer ne peut etre preleve qu'a partir de 
proteines humaines de transport du fer telles que la transferrine et la 
lactoferrine puisque la quantit6 de fer sous forme libre est negiigeable chez 
l'homme (de l'ordre de 10" 18 M), en tout cas insuffisante pour permettre la 
croissance bacterienne. 

Ainsi, N. meningitidis possede un recepteur de la transferrine humaine 
et un recepteur de la lactoferrine humaine qui lui permettent de fixer ces 
proteines chelatrices du fer et de capter par -la suite/le.fer necessaire a sa 
' croissance. 

Le recepteur de la transferrine de la souche AT. meningitidis B16B6 a 
ete purine par Schryvers et al (WO 90/12591) a partir d'un extrait 
membranaire. Cette proteine telle que purinee apparait essentieUement 
constituee de 2 types de polypeptides : un polypeptide d'unpoids moleculaire 
-apparent eleve de 100 kD et un polypeptide d'un poidsmoieculaire.-apparent 
moindre d'environ 70 kD, telles que reveles apres electrophorese sur gel de 
de polyacrylamide en presence de SDS. 

Le produit de la purification notamment mise en oeuvre par Schryvers 
est par definition arbitraixe et pour les besoins de la presente demande de 
brevet, appeld recepteur de la transferrine et les polypeptides le constituant, 
des sous-unites. Dans la suite du texte, les sous-unites de poids moleculaire 
eleve et de poids moleculaire moindre sont respectivement appelees Tbpl et 
Tbp2. 

Toutefois, le proced6 de purification decrit par Schryvers et al ne peut 
pas etre utilise pour la production a grande dchelle du. recepteur de la 
transferrine. La preparation industrielle de ce r6cepteur sous forme puri&ee 
passe necessairement par une etape de production a l'aide d'un systeme 
d'expression heterologue. 
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A cette fin, 1'invention se propose de fournir les fragments d'ADN 
codant pour les sous-unites du recepteur de la tcansfezrine de N. meningitidis. 

D'autre part, depuis les travaux pipnniers de Schryvers et al, on a 
decouvert qu'il existait en fait au moins 2 types de soucbes qui different par 
la constitution de leurs receptees de la transf errine respectifs. Ceci a fete mis 
en evidence en etadiant des extraits membranaires de plusieuxs dazames ae 
souches de AT. meningitidis d'origines vaxiees. Ces extraits membranaires ont 
tout d'abord ete soumis a une electrophorese sur gel de polyacrylamide en 
presence de SDS, puis electrotransferes sur feuilles de nitrocellulose. Ces 
feuilles de nitrocellulose ont ete incubees : 

a) en presence d'un antiserum de lapin dirige. contre le recepteur de la 
transferrine purine a partir de la souche N. meningitidis B16B6, aussi 
appeleeIM2394 ; 

b) - en presence d'un antis6rum de lapin dixige contre le recepteur de la 

transferrine purifie a partir de la souche N. meningitidis IM2169 ; ou 

- c y- en presence dela transferrmehumameconjugueealaperoxydase, 

En ce qui concerne a) et b), la reconnaissance des sous-unites du 
rfecepteur de la transferrine est revelee par addition d'un anticorps anti- 
immunoglobulines de lapin couple a la peroxydase, puis par addition du 

substrat'de cette enzyme. 

Les tableaux I et H ci-dessous indiquent le profil de certaines souches 
representatives tel qu'il apparait sur gel de polyacrylamide a 7,5 % apres 
electrophorese en presence de SDS ; les bandes sont caracterisees par leur 
poids moLeculaires apparents exprimes en kilodaltons (kD) : 
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Les resultats repertories dans les 2 premieres lignes des tableaux 
montrent qu'il existe 2 types de souches : 

Le premier type (Tableau I) correspond a des souches qui possedent 
un recepteur dont les 2 sous-unites dans les conditions experimentales 
utflisees, sont reconnues par 1' antiserum anti-recepteur IM2394 tandis que 
seule la sous-unite de haut poids moleculaire est reconnue par l'antiserum 
anti-recepteur IM2169. 

Le second type (Tableau IT) correspond a des souches qui possedent 
un recepteur dont les 2 sous^unites dans les conditions experimentales 
utilisees, sont reconnues par Tantiserum anti-recepteur IM2169 tandis que 
seule la sous-unite de haut poids moleculaire est reconnue par l*antiserum 
anti-recepteur IM2394. 

En consequence, il existe une diversite antigenique au niveau de la 
sous-unite de moindre poids moleculaire. Cette diversite est toutefois 
restreinte puisqu'elle se resout en 2 grands types, contrairement a ce qui est } 
_..suggere par GriffiAs et al, 

En verru de ces constatations, on pouvait supposer qu'un vaccin efficace 
a 1'encontre de toutes les infections a N. meningitidis pourrait etre constitue 
de maniere suffisante, de la sous-unite de haut poids moleculaire, quelle que 
soit la souche d'origine du recepteur, puisque cette derniere est reconnue par 
les 2 types d'antiserums. Toutefois, il semble que cela ne puisse etre le cas 
dans la mesure ou la sous-unite de haut poids mol6culaire ne serait pas 
capable d'induire la production d'anticorps de type neutralisant, Seule la plus 
petite des 2 sous-unites du recepteur serait capable de remplir cette fonction. 
Puisque cette sous-unite de moindre poids moleculaire se caracterise par une 
variation antigenique significative du premier type au deuxieme type de 
souche, un seul type de recepteur de la transferrine ne devrait pas etre 
suffisant pour vacciner centre toutes les infections a K meningitidis. Par 
consequent, un vaccin devra contenir au moins la sous-unit6 de moindre 
poids moleculaire de chacune des souches IM2394 et IM2169 ou de leurs 
equivalents respectifs et, de maniere optionnelle, la sous-unite de haut poids 
moleculaire d'au moins une souche de N. meningitidis. 
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Cest pourquoi l'invention foumit un fragment d'ADN isole codant 
pour une proteine capable d'etre reconime par un antiserum anti-rscepteur 
de la souche de N. meningitidis IM2394 ou IM2169. 

Un tel fragment d'ADN peut notamment comprendre une sequence 
nucleotidique codant pour une sequence d'acides amines homologue a celle 
telle que montree : 

- dans l'identificateur de sequence (SEQ ID NO : 1) n° 1, commencant avec 
le residu cysteine en position 1 et finissant avec le residu glutamine en 
position 579 ; 

- dans le SEQ ID NO : 2, commencant avec le residu acide glutamique en 
position 1 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commencant avec le residu acide glutamique en 
position 1 et finissant avec le residu phenylalanine en position 887 ; ou j 

- dans le SEQ ID NO : 4, commencant avec le residu cysteine en position 1 
"et finissant a7ec Tie r ^du glutamic 

A titre indicatif, on precise qu'un fragment d'ADN selon l'invention 
peut en outre comprendre une sequence nucleotidique additionnelle codant 
pour n'importe quelle autre sequence d'acides amines ; les deux sequences 
nucleotidiques considdrees, formant un cadre ouvert de lecture de maniere a 
coder pour une proteine hybride ou un precurseur. 

De maniere avantageuse, un fragment d'ADN selon l'invention peut 
etre selectionne par mi : 

i) Un premier fragment d'ADN- isole, ayant une sequence nucleotidique 
codant pour une proteine ayant une sequence d'acides amines homologue 
a celle tele que montree dans le SEQ ID NO : 1, commencant avec le 
residu cysteine en position 1 et finissant avec le residu glutarmne en 

position 579- 
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ii) Un deuxieme fragment d'ADN isole ayant une sequence nucleotidique 
codant pour une proteine ayant une sequence d'acides amines a celle 
telle que montree dans le SEQ ID NO : 2, commencant avec le residu , 
acide glutamique en position 1 et fmissant avec le residu phenylalanine 
en position 884. 

iii) Un troisieme fragment d'ADN isol6 ayant une sequence nucleotidique 
codant pour une proteine ayant une sequence d'acides amines a ceUe 
telle que montree dans le SEQ ID NO : 3, commencant avec le rdsidu 
acide glutamique en position 1 et finissant avec le residu phenylalanine 
en position 887. 

iv) Un quatrieme fragment d'ADN isol6 ayant une sequence nucleotidique 
codant pour une proteine ayant une sequence d'acides amines a celle 
telle que montree dans le SEQ ID NO : 4, commencant avec le residu 
cysteine en position 1 et finissant avec le residu glutamine en position 
691. 

I 

Par "sequence d'acides amines homologue", on entend une sequence 
presentant un degre d'homologie d'au moins 75 %, de maniere avantageuse 
d'au moms 80 %, de maniere preferee d'au moins 90 %, de maniere tout a 
fait prdferee de 100 %, avec la sequence d'acides amines que l'on cite en 
reference. On notera que le terme "homologue" tel que defmi inclut le cas 
particulier.de I'identite. 

Le degre d'homologie peut etre aisement calcul6 en alignant les 
s6quences de maniere a obtenir le degre maximal d'homologie ; pour ce 
faire, il peut etre necessaire d'introduire artificieUement des emplacements 
vacants, comme cela est illustre dans la figure 7. Une fois que l'alignement 
optimal est realise, le degre d'homologie est etabli en comptabilisant toutes 
les positions dans lesquelles les acides amines des deux sequences se 
retrouvent a l'identique, par rapport au nombre total de positions. 
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• r -a- a* ri-rrire d-s sequences bomologues autrement 
II serait fastidieux de oecnre u~s - 

* - ■ du troo «n:and nombre de combinaisons. 

nue de maniere genenque, en raison ou nop 0 i^« , 
que ae roaiuei. 0 . - r x eles oenerales am permettent de 

T 'hornme du metier cormait toutefois les regies e c» . jr 

oororne °u n u j f onc tion biologique ou 

remplacer un acide amine par un autre sans aoonr 

immuiiologique d'une proteine. 

Uo fragment d'ADN isole et tout a fait prefer* a une siquence 

nucleotidique codantpour: 

ft La sous-unite Tbpl de la soucbe IM2394 dont la sequence en acides 
i) La sous unuc v commencant avec 

amines est telle que montree dans le SEQ ID NU A T~ r6sidu 
le residu acide glutarnique en position 1 et fixussant avec le resxou 
phenylalanine en position 884 ; 

ffl La sous-unit6 Tb P 2 de la souche IM2394 dont la sequence en acides 
u) La sous unu v comm engant avec le resxdu 

amines est montree dans le SEQ ID iNU . i, cu v - ti 
cysteine en position 1 et finissant avec le rdsidu glutanune en posxtxon ^ 

579; 

iffl La sous-unite Tbpl de la souche M2169 dont la sequence en acides 

^de gllmique en position X et fhnssan, avec ie residu pbenv^arune 

ea position 887 ; ou 

• iv) La sous-unite Tbp2 de U soucbe IM2169 don. la sequence >~ acides 
' amin6s est montree dans le SEQ ID NO : ^commencant avec le resttu 
cysteine en position I et finissant avec le rdsidu glutanune en po>moa 
691 . 

Le recepteur de la transferrin «an. une proteine membranaire 
chacune de ses sous-unites est initialed produite sous forme dun 
Poseur constitue d'un peptide signal associe en potion N-.enntnale, a la 

forme mature. 
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- DO ur obiet un bloc d'ADN isole 

C'est pourquoi l'invention c aussi poui uuj 

m -„„ a i rintf ia sequence d'acides amines presente un 
codant pour un peptide signal aon_ ^ ^ ^ fe 

degre d'homologie d'au moins 80 9e, de.man.-re P 
sequence montree dans : 

0 „_ r ip residu m6thionine en position 

i) le SEQ ID NO : 2, commencaiu avec le resiou meua 

- 24 et finissant avec le residu. alanine en position - 1 ; 

ii) le SEQ ID NO : 3, comrnencant avec le residu m6thionine en position 

- 24 et finissant avec le residu alanine en position - 1 ; ou 

iii) le SEQ TD NO .: 4, comment avec le residu methionine en position 

- 20 et fuiissant avec le residu alanine en position - 1. 

Tin fragment d'ADN setoa l'invention pent etre aussi selection^. 
• sbdime s-ptieme et huitieme fragments d'ADN codant 

respectivement pour un precurseur dont la sequence d acides amines est 
Zologue a la sequence presentee dans le SEQ ID NO : 1, 2, 3 ou 4. 

"par "fragment oublocd-ADN^ 
d'ADN IrigT genomique qui est i) insere dans un vecteur vn* - 
aAUiN aong s ■ i- controie d'un promoteur qui lui e SL 

plasmidique ou u) place soos 1~ controie v 

heterologue. 

De plus le bloc d'ADN cod^t pour le peptide signal selou 1'mveution 
e, e„ o^considere comrne isole lorsoue ce bloc d'ADN est assoctei un 
fragment d'ADN coda,, pour une Ptoteine h *tero,ogue au 
ma Lere I former un cadre de lecture ouvert codant pour ua precursor 

bybride. 

Invention conceme aussi une cassette d'expression qui co»P^ 
, nt rT ADN selon l'invention, place sous le controie 
moins un fragment d ADN selo cellu i e -h6te 
d'elements capables d'assurer son expression 

appropriee. 
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Dans la cassette ^expression, le premier, deuxieme, iroisieme ou 
quatrieme fragment d'ADN selon l'invention peut etre ou non associd a un 
bloc d'ADN codant pour un peptide signal heterologue a la protege codee 
par ledit fragment d'ADN, selon que l'on recherche ou non la s6cretion de la 
proteine. De preference, cette secretion sera recherchee. 

Les elements indispensables a l'expression d'un fragment d'ADN 
selon l'invention sont un promoteur de transcription, des codons de debut et 
de fin de traduction et, de maniere optionnelle, un terrninateur de 
transcription. Le promoteur peut etre constitutif ou inductible. On indique 
que le fragment d'ADN codant pour la sous-unite Tbp2 de la souche IM2394 
semble etre toxique pour une cellule heterologue, notamment poux E. coll 
Dans ce cas la, il pourrait etreprefdrable d'utiliser un promoteur inductible. 

Des elements tels qu'un bloc d'ADN codant pour un peptide signal 
heterologue (region signal) ou un promoteur existent deja en assez grand 
nombre et sont connus de l'homme du metier. Ses competences generates lux 
permettront de choisir une region signal ou un promoteur particulier qui , 
seront adaptes a la cellule-hote dans laquelle il envisage l'expression. 

E^-l'invenuon^ounnt^ 

polypeptide ou d'une proteine capables d'etre reconnus par un antiserum 
anti-recepteur de la souche de N. meningitidis IM2394 ou IM2169 qui 
comprend l'acte de cultiver une cellule-hote comportant une cassette 
d'expression selon l'invention ; ainsi que le peptide, le polypeptide ou la 
proteine produit par ce precede et les compositions vaccinales ies contenanL 

Aux fins du procede selon l'invention, la cellule-hote peut etre une 
cellule de mammifere, une bacterie ou une levure ; ces deux dernieres etant 
preferees. La aussi, le choix d'une lignee particuliere est a la portee de 
l'homme du metier. 
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Afin de determiner l'objet de la presente invention, on precise que les 
souches de N. meningitidis IM2394 et IM2169 sont publiquement disponibles 
aupres de la Collection Nationale de Culture des Microorganismes (CNCM), 
Institut Pasteur, 25 rue du Dr Roux 75015 Paris sous les numeros 
d'enregistrement respectifs LNP N 1511 et LNP N 1520. 

Un antiserum specifique du recepteur de la transferrine de la souche 
de A*! meningitidis IM2394 on IM2169 peut etre obtenu tel que decrit dans les 
exemples ci-apres. 

L'invention est decrite plus en d6tails dans les exemples ci-apres et 
par reference aux Figures 1 a 8. 

La Figure 1 represente la structure du phage lambda ZAP H et 
schematise la methodologie de clonage y afferent. Lambda ZAP H est un 
vecteur d'insertion equipe de sites de clonage multiples localises dans la 
partie plasmidique (pBluescript SK). Cette partie plasmidique peut etre 
excisee in vivo oar co-infection avec un phage-helper et convertie en vecteur , 
plasmidique. Si une sequence codante est fusionnee en phase a lacZ ou si un 
--.fragTnent^'ADJ^cloae_cornporte_ m ^^ 
peut y avoir production d'une proteine d'interet qui pourra etre detectee a 
l'aide d'anticoips specifiques. 

La Figure 2 presente la structure du plasmide pTG1265. pTG1265 
derive du plimide pGB2 (Churchward et aL, Gene (1984) 31 : 165) comme 
suit • pGB2 est digere par EcoRI et HindllJ, traite a la polymerase Klenow 
puis ligue au fragment Sspl - PvuII de 1 kb issu de pT7T3 184 (Mead et al, 
Protein Engineering (1986) 1 : 67 ; Pharmacia) qui comporte fl-on, la 
sequence lacZ, les promoteurs T3 et T7 ainsi que des sites multiples ae 
clonage. 

La Figure 3 presente la carte genomique de la region d'ADN de la 
souche IM2394 comportant les sequences codant pour Tbpl et Tbp2 ainsi 
que les differents fragments qui ont ete clones. B = BamHl ; E - EcoRI ; H 
= Hindi ; R = EcoRV ; X = Xbal ; C = ClaL 
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La Figure 4 presente la cane genomique de la region d'ADN de la 
souche IM2169 comportant les sequences codant pour Tbpl et Tbp2 ainsi 
que les differents fragments qui ont ete clones. C = Clal ; H = Hindi ; M = 
MhJ ; X = Xbal ; ? = position imprecise. 

5 

La Figure 5 presente la structure du plasmide para.13. paral3 est un 
plasmide capable de se repliquer dansS. coli qui comporte le promoteux de 
■ l'operon arabinose BAD (ParaB) de Salmonella typhimurium (modifie au 
niveau de la TATA box), ainsi que le gene AraC. En aval du promoteur 
10 ParaB se trouve des sites multiples d'insertion. La serie des plasmides para 
est decrite par Cagnon et al, Prot. Eng. (1991) 4 : 843. 

La Figure 6 represente la methodologie qui a ete mise en oeuvre pour 
construire le vecteur d' expression pTG3786. 

15 

La. Figure 7 compare les sequences d'acides arnines predites des sous- 
unites TDpl des souches IM2394- et IM2169. Le degre d'bomologie peut etre 
estirne a environ 76 %. 

20 -I^-Figure^^ropare4es-s6qu^ 

unites Tbp2 des soucbes IM2394 et IM2169. Le degr6 d'homologie peut etre 

estime a environ 47 %. 



25 



La. Figure 9 represente la methodologie qui a 6te raise en oeuvre pour 
contruire le vecteur d'expression pTG3779. 
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EXEMFLE 1 : Clonage des fragments d'AJDN codant pour ies sous-unites 
Tbpl et Tbp2 du recepteur de la transierxine de la souche 
IM2394 

1A - Culture de la souche et purification du recepteur de la transferrine 

Un lyophilisat de la souche N. meningitidis IM2394 est repris dans 
environ 1 mi de bouillon Muller-Hinton (BMH, Difco). La suspension 
bacterienne est ensuite etalee sur le milieu solide Muller-Hinton contenant 
du sang cuit (5 %). 

Apres 24 hr d'incubation k 37°C dans une atmosphere contenant 10 % 
de CO2, la. nappe bacterienne est recueillie pour ensemencer 150 ml de 
BMH pH 7.2, repartis en 3 erlens de 250 ml. -L'incubation est poursuivie 
pendant 3 hr k 37°C sons agitation. Chacune des 3 cultures ainsi realisees 
permet d'ensemencer 400 ml de BMH pH 7,2 supplements avec 30 Mm de 
Ethyienediamine - Di (O-Hydroxyphenyl - acetic acid (EDDA, Sigma), qui 
, est un agent chelatant du fer sous forme libre. 

Apres 16 hr de culture k 37°C sous agitation, les cultures sont 
controlees -pour -~leur "pnrete-pax~-observation~ atr "micf dscdpe "~ apres' line" 
coloration de Gram. La suspension est centrifugee. le culot contenant les 
germes est pes6 et conserve k -20°C. 

La purification est raise en oeuvre essentiellement seion la m6thode 
d£crite par Schryvers et al (supra), comme suit : 

Le culot bacterien est decongele, puis remis en suspension dans 200 
ml de tampon Tris HC1 50 mM, pH 8.0 (tampon A). La suspension est 
centrifugee pendant 20 min k 15 000 xg k 4°C Le culot est r6cuperd, puis 
remis en suspension dans du tampon A k la concentration finale de 150 g/1. 
Des fractions de 150 ml sont traitees pendant 8 min k 800 bars dans un lyseur 
de cellules travaillant sous haute pression (Rannie, module 830H). Le lysat 
cellulaire ainsi obtenu est centrifuge pendant 15 min k 4°C k 15 000 xg. Le 
surnageant est recupere, puis centrifuge pendant 75 ruin k 4°C k 200 000 xg. 
Apres elimination du surnageant, le culot est repris dans du tampon A et 
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apr^s dosage de prolines selon Lowry, la concentration de la suspension 



A 1,4 ml de la suspension de membranes on ajoute 1,75 mg de 
transfenine humaine biotinylee selon le procede ddcrit par Schryvers. La 
concentration finale de la fraction membranaire est de 4 mg/ml. Le melange 
est incub6 1 heure k 3TC puis centrifuge k 100 000 xg pendant 75 minutes k 
4°C. Le culot de membranes est repris par le tampon A contenant du NaCl 
0,1M et in'cub6 pendant 60 minutes k temperature ambiante. 

Apr&s solubilisation, on ajoute a cette suspension un certain volume 
de N-Lauroyl Sarkosine k 30 % (p/v) et d'EDTA 500 mM de fa?on que les 
concentrations finales en Sarkosyl et EDTA soient de 0,5 % et 5 mM 
respectivement. Apr&s une incubation de 15 minutes k3TC sous agitation, 
on ajoute 1 ml de resine strepavidine-agarose (Pierce) prdalablement lavee 
en tampon A- La suspension est incubee 15 minutes k temperature ambiante 
puis centrifugde k 1 000 xg pendant 10 minutes. La resine est ensuite 
conditionn6e dans une colonne et l'eluat direct est 61imin6. , 

La resine est lavee par 3 volumes de colonne de-tampon Tris-HCl 50 
mM pH 8.0 contenant NaCl 1M, EDTA 10 mM Sarkosyl 0,5 % (tampon B) 
pu^ par am 

750 mM. Le recepteur de la transfemne est ensuite elu6 par le tampon B 
contenant de la guanidine-HCl 2M. L'eluat est collecte en fractions, dans des 
tubes contenant un volume identique de Tris HC1 50 mM, pH 8.0, NaCl 1ML 
La densit6 optique k 280 nm de l'eluat est mesuree en sortie de colonne k 
l'aide d'un detecteur UV. 

Les fractions correspondant au pic d'elution sont recueillies, dialys6es 
contre du tampon phosphate 10 mM, pH 8,0 contenant du Sarkosyl 0,05 % et 
lyophilisdes Le lyophilisat est repris dans de l'eau k une concentration 10 fois 
superieure. La solution est dialys£e une seconde fois contre du tampon 
phosphate 50 mM pH 8,0 contenant du Sarkosyl 0;05-% (tampon C) puis la 
solution est filtree sur une membrane de porosite 0.22 jsm. 

Le contenu en proteines est determine et ajust6 k 1 mg/ml par 



ajustee a 5 mg/ml. 
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addition tampon Q sous conditions aseptiques. Cette preparation est 
conserves a -7C"C. 

IB - Preparation d'un antiserum specifique du r^cepteur de la transferrin 

5 Des lapins neo-zelandais albinos regoivent par voie sous-cutanee et 

anuiscoiaire 100 Mg du recepteur IM2394 en presence d'adjuvant complet 

^■Fze&ad. 21 3°™* et 42 J ours a P res la P remiere in - iection ' les 
dC 'venl a notfveau 100 n% du r6cepteur purifie mais ces fois-ci en presence 
X TxZzs± incomplet de Freund. 15 jours apres la derniere injection, le 
10 * des arrimaux est oreleve, puis decomplemente et filtre sur une 

^ ane de porosite 0,45 /xm. Le filtrat est par la suite epuise par contact 
xaemD soucb ; ^2394 qui pour se faire, a ete cultivee au prealable en 
aVeC ce a- Ser sous forme libre (dans ces . conditions, la synthese du 
P '" e ° d „ ia transferrine est reprimee). Les modalites de contact sont 
15 1 e snil ' -'0 ml du filtrat sont ajoutes a 10 10 cfu (unites formant des 
cornme ^ ^ ^ IM2394. Uadsorption est poursuivie une 

colome ^ ^ agita tion. Les bacteries sont ensuite 61ixninees par 
centrifugal^ 1^ sumageani est recupere puis soumis a nouveau a 2 
operations d'adsorption successives comme precedemment d6crit. 
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1C . Determination des sequences peptidiques permettant identification 
des fragments d'ADN. 

D ^ s fractions aliquotes du materiel obtenu en 1A sont sechees puis 
b ise~ C2J2S le tampon de Laemmli deux fois concentr6 (Tris 65mM, 
SDS U 3 %, &c*ol 10 %,,2-mercaptoethanol 5 %). On ajoute un volume 
d'eau dquivalfisxt- 

Anre^ so^ication, le materiel est cbauff e a 90°C pendant 2 minutes, puis 
Jsl une aectrophorese sur gel de poiyacrylamide. Les sous-unites ainsx 
T^^t traJerees sur membrane PVDF (In-obilon, MilHpore) 
P A»r« 16 "heures a 400 mA en tampon Tris borate 50 mM, pH 8,3. Les 
cLites electrotransferees sont colorees a 1'arnido. black et les bandes 
35 rorrespoudan, a Tbpl et Tbp2 sont recuperees et soumises au 
microsequencage de 1'extremite N-terminale. 
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Ceci est r6pet6 plusieurs fois pour etablir les sequences consensus N- 
terrniriales suivantes : 

Tbpl IM2394 : EXVQ AEQ AQEKQLDTIQ V 
Tbp2lM2394: XLXXXXSFDLDSVEXVQXMX 

(X = acide amine non^etermine). 

Afin de sequencer des regions internes de Tbp2, la protdine sur 
membrane PVDF est soumise a digestion par la trypsine en tampon Tris 0,1 
M pH 8 2. Apres 4 beures de reaction a 37°C, les peptides sont extraits par de 
racide formique 70 % puis par de I'acide trifluoroacetique (TFA) 0.1 %- Ces 
peptides sont ensuite separes par HPLC. 

Pour Tbp2 IM2394, les sequences internes qui ont ete 6tablies sont les 

suivantes : 

S1122 : NNIVLFGPDGYLYYK 

S1125: YTIQA _ j 

S'*770: DGENAAGPATEXVIDAYR 

— -S"766-c XQIDSEGDYX 

S1126 : AAFXXXI 

S169 : XNXXXMFLQGVR 

S"771 : TPVSDVAAR 

S"767 : XSPAFT 

S"762: NAIEMGGSFXFPGNAPEG(K) 

S1128: XQPESQQDVSENX 

ID - Preparation de l'ADN genomique. 

Le culot bactdrien obtenu en 1A est resuspendu dans environ 25 ml de 
solution A (Tris HC1 25 mM. P H 8 contenant 50 mM de glucose et 10 mM 
d'EDTA) additionn6e de 10 mg de proteinase K- Le melange est laisse 1U 
minutes a temp6rature ambiante. 
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Puis on ajoute 12,5 ml de solution A contenant 10 mg de lysosyme. Une 
nouvelle ibis, le melange est laisse 10 minutes a tern P 6rature arnbtante. On 
complete alors par 0,5 ml de sarkosyl 10 %. U> melange est mcuoe 10 

minutes 2l t-4°C. 

5 On ajoute ensuite 2 mg de RNAse et on laisse IWbation se 

pouxsuivre 90 minutes a 37°C. L'ADN est P urifi6 par quatre extractions 
pbenoliques successive^ L'ADN present dans la demiere phase aqueuse est 
pr6cipite par I'ethanol. L'ADN de haut poids moleculaire est obtenu par 

10 separation sur gradient de CsCl. 



IE- Clonage. 

Une premiere banque d'ADN a eta realisee dans le vecteur lambda 
15 ZAP (Figure 1), comme suit : 

Une preparation d'ADN genomique a ete fragment6e aux ultra- 
sons. Les extrdmites des fragments ainsi obtenus ont ete rendues tranches par , 
traitement a la T 4 polymerase. Les fragments ont ete ^f^ ^ 
20 m6thylation, les fragments ont ete lies a des adaptateurs EcoRI, trait* par 
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La souche E. coli XLl-Blue (Stratagene) a ete infectee avec la 
banque d'ADN ainsi prdparee. Les plages de lyse blanches (presence de 
phages recombinants) ont ete testees a 1'aide d'un antrum spdofique du 
xecepteur del* transferrine de la souche IM2394 prepare tel que decnt en 
IB Ceci a permis d'idenufier deux clones lambda ZAP H. Les plasrmces 
pBluescript contenus dans ces clones ont et£ excises par co-infectxon avec le 
phage-"helper" et ont ete appeles pBMTl et pBMT2. 

Les plasrnides pBMTl et P BlvCT2 contiennent chacun un fragment 
EcoRI - EcoRI respectivement de 3,8 kb et 1,3 kb. lis sont present6s dans la 

Figure 3. 

Le sequent de finsen EcoRI - EcoRT de.pBMTl a ete mi, « 
ceuvie scion la methods de shotgun (BanWer e. BarreU, Biochemistry (1983) 
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B5 : 508), comme suit : 

Uinsert EcoRI - EcoRI de pBMTl a ete purifie puis fragment6 aux 
ultra-sons. Les extremites des fragments ainsi obtenus ont etd rendues 
francb.es par traitement a la T 4 polymerase. Les fragments ainsi traites ont 
ete introduits dans un site du phage M13TG131 (decrit dans Kieny et al, 
Gene (1983) 2£ : 91). Environ 200 clones issus de cette preparation ont 6te 
sequences. L'analyse de ces sequences par ordinateur a permis de 
reconstituer la sequence complete de l'insert EcoRI - EcoRI de pBMTl. 

r 

La s6quence codant pour l'extremite N-termiiiale de Tbpl a et6 
localisee comme le montre la Figure 3. Compte tenu de la masse mol6culaire 
de Tbpl, il etait dair que.cet insert ne comportait pas le fragment d'ADN 
complet codant pour Tbpl. En amont de. l'extremite 5' du gene tbpl, on a mis 
en evidence un cadre de lecture ouvert mais il n'a pas et6 possible 
d'identifier clairement une region codant pour l'cxtr&nit6 N-terminale du 
gene tbp2. 

j 

Le microsequengage de regions internes de Tbp2 a done ete 
entrepris comme reporte precedemment en 1C. Les sequences internes qui 
etaient localisees vers rexuremite C-teraninale, correspondaient bien a la 
partie 3' du cadre de lecture ouvert en amont de tbpl. 

D'autre part, l'ADN genomique de la souche IM2394, 
prealablement dig6r6 par Hindi a ete analyse par Southern blot a Taide 
d'une sonde d'ADN radioactive correspondant a la zone Hindi - Hindi de 
1,5 kb de l'insert de 3,8 kb de pBMTl ; deux bandes ont 6t6 ainsi revdlees. 
Ceci a permis de demontrer que l'insert porte par pBMTl r6sultait d'un 
assemblage artefactuel de sequences issues de deux loci distincts. La 
sequence 5' de tbp2 6tait done absente. 

La banque d'ADN genomique en lambda ZAP precedemment 
decrite a 6te criblee de nouveau ; cette fois-ci en utilisant l'insert EcoRI - 
EcoRI de P BMlT2 comme sonde. 29 candidats ont ete retenus parmi environ 
200 000 plages test6es. Seul le plasmide d6rive pTG2749 semblait possdder 
un insert nouveau par rapport a pBMTl et pBMT2. L'insert de pTG2749 est 
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tel que represents dans la Figure 3. La region de Tinsert en amont du site 
EcoRV (region EcoRV - EcoRI) a ete sous-clonee dans M13TG131 et 
sequencee par la methode de Sanger et al, PNAS (1977) 74 : 5463 a Taide de 
primers synthetiques. La sequence correspondant a l'extremite N-terminale 
de Tbp2 a ete ainsi retrouvee. 

La sequence du fragment d'ADN codant pour Tbp2 de la souche 
IM2394 est presentee dans le SEQ ID NO : 1 ainsi que la sequence d'acides 
amines correspondante. 

Juste en amont de la sequence codant pour Tbp2 mature, Finsert 
de pTG2749 comporte une region genomique distincte issue d'un autre locus. 
La aussi ? il s'agit d'une artefact de clonage analogue a celui mis en evidence 
. dans le cas de pBMTl . 

Compte tenn des rearrangements observes et de Tabsence de 
sequences 3' de tbpl et 5' de tbp2 } la banque d'ADN genomique construite en 
lambda ZAP a ete jugee inadaptee pour la poursuite du clonage. 

Une deuxieme banque d'ADN genomique a done ete construite 
dans "im pr^mlde 11 pr ep ar ation 

d'ADN genomique a ete parti ellement digeree par Sau3A. Des fragments 
d'ADN d'environ 4 k 6 kb ont ete purifies apr£s fractionnement en gradient 
de sucrose et ins6res dans le site BamHI du plasmide pTG1265. Cette 
preparation plasmidique a servi k transformer la souche d*E. coli 5KL On a 
estime que cette banque contenait environ 18 000 clones independants. 

Environ 50 000 clones de la deuxieme banque ont ete testes k 1/aide 
d'une sonde radioactive correspondant k Tinsert EcoRI - EcoRI de pBMT2. 
Un seul clone a ete revele ; soit le plasmide pTG2759 qui poss&de un insert 
de 1,8 kb. La taille de cette insert a et6 jugee insufBsante pour contenir le 
gene complet codant pour Tbpl. 

Une troisi&me banque d'ADN a ete construite selon la methode 
decrite au paragraphe precedent a l'exception de la souche dE. coli 5K qui a.- 
ete rempiacee par la souche dE. coli SURE (Stratagene). On a estime que 
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cette banque contenait environ 60 000 clones independants. 

Environ 70 000 clones de la troisieme banque d'ADN ont dte testes 
a l'aide d'une sonde radioactive correspondant au fragment Mlul - Hindi de 
2,4 kb issu de l'insert de pTG2754 decrit dans l'Exemple 2 ci-apres et 
represents dans la Figure 4. Deux clones ont ete reveles, soient les plasrnides 
pTG2780 etpTG2781, representes dans la Figure 3. 

La sequence des inserts de pTG2780 et pTG2781 a 6te etablie selon la 
methode de Sanger. Elle est presentee dans le SEQ ED NO : 2 ainsi que la 
sequence d'acides amines correspond ante. 

Une quatrieme banque a ete construite. Le DNA genomique a ete 
dig6re par Sau3A et une fraction contenant des fragments d' environ 7 kb a 
ete puriflee sur gradient de sucrose. Cette fraction contenait tie fragment 
correspondant au locus tbpl,2 car elle etait reconnue par une sonde d'ADN 
specifique de tbp2. Apres digestion par EcoRV etXbal et ligation a pTG1265 
digere par Smal txXbal, E coli 5K a et6 transformde. Un criblage des clones 
a l'aide d'une sonde specifique de tbp2 a ete realise. Parmi une serie de 
clones jjositifs, le plasmide pTG3791 a ete etudie en pardcuUer et s'est avere 
contenir des sequences 5' tbp2 incluant la sequence codant pour le peptide 
signal putatif de-Tbp2.- — - " " 

EXEMPLE 2 : Clonage des fragments d'ADN codant pour les sous-unites 
Tbpl et Tbp2 du recepteur de la tamsferrine de la souche 
IM2169. 

2A - La culture de la souche IM2169 et la purification du recepteur de la 
transferrine ont ete effectuees dans des conditions identiques a ceUes 
decrites dans l'Exemple 1A_ 

2B - La preparation d'un antiserum anti-recepteur de la souche IM2169 a 
ete realis6e selon le protocole decrit dans l'Exemple IB. 

2C- Les s6quences peptidiques permettant l'identification des fragments 
d'ADN ont ete deterrninees selon la methode reportee dans l'Exemple 1C. 
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Les microsequences qui ont ete etablies sont les suivantes. 

Sequence consensus de l'extremite N-terminale de Tbpl 
EN\^QAGQAQEKQLXXIQVX 

Sequences des peptides internes de Tbpl : 



S1031 
S1032 
S1033 

10 ' S1034 



XLS(E,W)NAGXVLXPADX 
QLDTIQVK 

TAGSSGATNEIEYENXX 
YVTWENVDXXXXXX 



Sequence consensus de l'extremite N-terminale de Tbp2 
SLVXAXSFDLXSV 

15 Sequences des peptides internes de Tbp2 : 



S1037 
S1035 
S1036 
S1040 



XXDNLSNAX 
XGDDGYIFYXGEKPX 
XQGXYGFAMX 
XQATGHENFQYVYSGXFYK 



2D- La preparation de l'ADN genomique de la souche IM2169 a. ete 
TeaTisee selon le protocole decrit dans I'Exempre ID. 



2E - CI on age 



Une premiere banque d'ADN genomique (fragments d'ADN Sau3A 
partiel ; pTG1265 ; E. coli 5K) a et6 construite comme prdcedemment decrit 
dans l'Exemple 1. On a estime que cette banque contenait environ 40 000 
clones independants 3 dont environ 70 % possedaient un insert de 4-6 kb. 

130 000 clones de cette banque ont ete testes a l'aide d'une sonde 
radioactive correspondant a l'iusert EcoRJ - EcoRI de pBMT2. 42 clones ont 
ete analyses, panni lesquels 2 ont ete retenus : les plasmides pTG2753 et 
pTG2754 qui sont tels que montres dans la Figure 4. Les analyses en 
Southern blot ont montre que les cartes de restriction des inserts de 
pTG2753 et pTG2754 correspondaient a la carte de restriction, de l'AJDN 
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genomique. 

La determination des sequences nucleotidiques et la recherche des 
regions codant pour les extremites N-tenninales et les regions internes ont 
5 demon tre que : 

Knsert de 1,9 kb de pTG2753 contient la partie 3' du gene tbp2 et la 
partie 5' du gene tbpl \ et 

10 - Tinsert de pTG2754 contient la partie 3' du g&ne tbp2 et les parties 5' et 
3* du gene tbpl, enrapture de phase. 

Cette premiere banque n'a done pas permis de doner des fragments 
d'ADN complets codant pour Tbpl ou Tbp2. 
is • • 

Une deuxieme banque genomique a ete construite comme 
preced eminent mais a partir d'ADN genomique digere par Xbal. Les 
fragments d'ADN ont ete purifies aprfes fractionnement en gradient de 
sucrose. Chaque fraction (d'environ 500 /xl) a ete testee par Southern blot 

2 0 avec une sonde radioactive correspondant k Textremite 3' de tbpl (fragment 

de Tinsert de pTG2754). La fraction presentant une reaction dTiybridation et 

contenant^des .Jragments._.dtenviron.^ 

souche E. coli 5K a ete transf ormee. 

25 Environ 2 400 clones de cette banque ont ete testes a Taide d'une sonde 

radioactive correspondant au fragment Hindi - Mini de 0,6 kb issu de 
pTG2754. Cinq clones ont ete caracterises, parmi lesquels 2 ont et6 retenus : 
soient pTG3720 et pTG3721, tels que montres dans la Figure 4, qui 
contiennent tous deux les genes tbpl et tbp2. 

30 

Afin de completer la sdquence nucleotidique codant pour Tbpl, Tinsert 
de pTG3720 a et6 sequence dans la region ou se situait la rupture de phase 
decouverte dans Tinsert de pTG2754. Ce sequen^age a permis de mettre en 
evidence que la rupture de phase de Tinsert de pTG2754 6tait due k une 

3 5 deletion de 22 bp. La sequence complete du fragment d'ADN est telle que 

montree dans le SEQ ID NO : 3. 
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Le secuencage de l'insert de pTG3720 a ete poursuivi pour etablir la 
sequence de tb P 2. Celle-ci a bien ete identifiee ; mais la aussi une rupture ae 

ph2se a ete constatee. 

Finalement la sequence de tb P 2 a 6te determine a partir du plasmide 
pTG3721. Elle est telle que montree dans le SEQ ID NO : 4. 

F.yRMPLE 3 : Expression du fragment d'ADN codant pour la sous-unite 
Tbp2 de la souche IMZ394. 

3A. Construction du vecteur d'expression pTG3786. 

Le site SphI du plasmide paral3 (Figure 5 ; Cagnon et al, Prot. Eng. 
• (1991) 4 : 843) a ete ddtruit par traitement a la polymerase Klenow, pour 
' donner le plasmide P TG3704. pTG3704 a ete linearise par coupure Ncol, 
traite a la polymerase Klenow pour rendre les extremites tranches, puis 

digere par HindlJI. 

D'autre part, on a synthase les oligonucleotides OTG4015 et 
2 o OTG4016 que l'on a apparies. 

OTG4015 -5' AAATACCTATTGCCTACGGCAGCCGCTGGACTGTTATTACT 

CGCTGCCCAACCAGCGATGGCATGCTTTCCCACGCGTTTTCCCA 3 ' 
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OTG4016 • 5 ' AGCTTGGGAAAACGCGTGGGAAAGCATGCCATCGCTGGTTGGGCA 
GCGAGTAATAACAGTCCAGCGGCTGCCGTAGGCAATAGGTATTT 3' 

Le fragment d'ADN double brin OTG4015/OTG4016 a ete insere dans 
paral3 traite comme precedemment decrit, pour donner le plasrmde 
pTG3717 dans lequel on avait reconstitue la sequence codant pour la partie 
N-terminale du precurseur de la proteine PelB 6'Erwinia carotovora (L^i et 
al, J. Bact. (1987) 169 : 4379) : Soit : 

?TG AAA TAC CTA TTG CCT ACG GCA GCC GCT GGA CTG 
^ "^et Lys Tyr Leu -Leu Pro Thr Ala Ala Ala Gly Leu 
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Sphl 

TTA TTA CTC GCT GCC CAA CCA GCG ATG GCA TGCTTT 
Leu Leu Leu Ala Ala Gin Pro Ala Met Ala 

Mlul Hlndlll 
CCCACGCGTTTTCCCA AGCTT 

(en souligne, apaxaissent les extremites de pTG3704) 

A partir du plasmide pTG2749, on a genere par PCR & Paide des 
amorces OTG4011 et OTG 4012, un fragment incluant la region codant pour 
la parti e N-tenninale de Tbp2, jusqu'au site Mlul interne, tel que montre 
dans la Figure 6. 

OTG4 011 : 

BaunHI Sphl 

5' AAAAA.GGATCC/GCA TGC CTG GGT GGC GGC GGC AGT TTC 3' 

Cys Leu Gly .... 

OTG4 012 : 

BamHI Mlul 
„5/„ AJg^GGATC 

Le fragment genere par PCR a ete digere par BamHI, puis insere dans 
le site BamHI du phage M13TG131, pour dormer M13TG3724. La sequence 
de ce fragment a ete verifiee par sequengage. 

A partir de M13TG3724, on a recupere la region codant pour la partie 
N-terminale de Tbp2 sous forme d'un fragment Sphl - Mlul que Ton insert 
dans pTG3717 prealablement digere par Sphl et Mlul, pour donner le 
plasmide pTG3743. 

A partir du plasmide pBMTl, on a recupere la region codant pour la 
partie C-terminale de Tbp2 sous forme d'un fragment MluI-BanI dont 
Fextxemite cohesive BanI avait ete rendue francbe.par traitement k la 
polymerase Klenow. On a insere ce fragment dans pTG3743 prealablement 
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digere par Hindffi, traite a la polymerase Klenow et fmalement digere par 
MluL On obtient ainsi le plasmide pTG3786. 

3B. Production de la sous-unit^ Tbp2. 

E. coli MC1061 (Casadaban Sc Cohen, J. Mol. Biol. (1980) 13£ : 179) 
est transformee par pTG3786 puis mise en culture k 37°C, en milieu LB 
supplemente avec 2 g/1 de glycerol A la culture est en phase exponentielle, 
on ajoute 0,2 g/1 d'axabinose. L'incubation a ete poursuivie durant 6 hr 
supplementaires. L'expression a ete observee moins d'une heure apres 
Paddition d'arabinose. 

L'electrophor&se sur gel d'acrylamide d'un echantillon du lysat 
celluiaire total a mis en evidence la presence d'une proteine d 7 environ 70 kD 
qui est capable de fixer la transferrine humaine marquee & la peroxydase. 

EXEMPLE 4 : Expression du fragment d'ADN codant pour la sous-unite 
tbpl de la souche IM2169. 

4A. Construction du Yecteur d'expression pTG37796. 

Un fragment synthetique constitue des oligonucleotides OTG4038 et 
OTG4039 prealablement apparies, a ete insere dans le plasmide pTG3704 
digere par Ncol et HindHI, generant ainsi le plasmide pTG3756. 

OTG4 03S : 

5 ' CATGGCTGCAGGRACCACGCGTGAATTCCCCGGGTCTAGA 3 ' 
OTG4039 : 

5 ' . AG CTT CT AG ACC CG G GG AATT CACG CG TG GT A C CTG C AG C 3 ' 

A partir du plasmide- pTG2754, on a genere par PCR k Faide des 
amorces OTG4037 et OTG4014 un fragment incluant la region codant pour 
l'extremite N-terminale du precurseur de Tbpl jusqu'au site MluL 



5 
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S^TTTCCCGGATCCGC ATG CAA CAG CAA CAT TTG TTC CGA TTA 3 

. BamHI SphI 

Met Gin Gin Gin... 



OTG4 014 : 

5' AAAAGGATCCGGGGTCGTAACGCGTCAGGTCGCGG 3' 
BamHI Mlul 

Ce fragment PCR a ete digere par BamHI et clone dans le site BamHI 
de M13TG131 pour generer M13TG3738. La sequence de ce fragment a ete 
verifiee. 

M13TG3738 a ensuite et£ linearise par 'SphI, traite a. la T4 DNA 
polymerase pour rendre les extremites franches, puis digere par Mlul afin 
d'isoTer le fragment porteur de la region codant pour l'extr6mite N-tenmnale 

du precurseur de Tbpl- 

Ce fragment a ete insere dans P TG3756 digere par Ncol, ' 
DNA polymerase puis digere par Mlul, pour generer le plasrmde pTG3778. 
-^-s^eHce-de-^QnctiQ^^ 

Le fragment Mini - Xbal de P TG3720 codant pour la majeure partie de 
Tbpl (3tbpl) a ete insere dans le plasmide pTG3778. Le plasmide final axnsr 
2 5 ob tenu est le plasmide pTG3779 . 

4B. Production de la sous-unit^ Tbpl. 

E. coli MC1061 a et6 transforme par P TG3779 puis mise en culture a 
37°C en milieu LB. A la culture en phase exponentielle, on a ajout6 0,2 g/1 
d'arabinose. L'incubation a ete poursuivie duxant 4 beures. 

™ - - : ■ Xelectrophorese sur gel d'acrylamide d'un echantillon du lysat 
«pSllulaire total a mis en evidence la presence d'une proteine d'envuon 100 
3 5 ; SKd T qui est capable de fixer la transferrine humaine marquee a la peroxydase. 
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SEP TP NO : 1 



Objet : Sequence de 1'ADN genornique de la souche de K meningitidis EM2394 

codant pour la sous unite Topi et sequence proteique deduite. En gras sont 
indiques le peptide signal et le site Mlul 



ATG AAC AAT CCA TTG IS 

Met Asn Asn Pro Leu 

-20 



GTA AAT CAG GCT GCT ATG GTG CTG CCT GTG TTT TTG TTG AGT OCT 
Val Asn Gin Ala Ala Met Val Leu Pro Val Phe Leu Leu Ser Ala 

TGT CTG GGT GGC GGC GGC AGT TTC GAT TTG GAC AGC GTG GAA ACC 
Cys Leu Gly Gly Gly Gly Ser Phe Aso Leu Asd Ser Val Glu Th- 
1 5 10 — 



15 



60 



105 



130 



195 



240 



GTG *CAA GAT ATG CAC TCC AAA CCT AAG TAT GAG GAT GAA AAA AGC 
Val Gin Asp Met His Ser Lys Pro Lys Tyr Glu Asp Glu Lys Ser 
20 25 30 

CAG CCT GAA AGC CAA CAG GAT GTA TCG GAA AAC AGC GGC GCG GCT 
Gin Pro Glu Ser Gin Gin Asp Val Ser Glu Asn Ser Glv Ala Ala 
35 40 * 45 

TAT GGC TTT GCA GTA AAA CTA CCT CGC CGG AAT GCA CAT TTT AA^ 

... _?yr„_Gly„.P„he... Al a .Val-.Lys ~Leu-Pro-Arg -Arg- Asn- Ala 'His - Phfe-Asn 

50 55 60 

CCT AAA TAT AAG GAA AAG CAC AAA CCA TTG GGT TCA ATG GAT TGG 285 
Pro Lye Tyr Lys Glu Lys His Lys Pro Leu Gly Ser Met Asd Tjtd 
65 . 70 ' 75 

AAA AAA CTG CAA AG A GGA GAA CCA AAT AGT TTT AGT GAG AGG GA^ 33 0 

Lys Lys Leu Gin Arg Gly Glu Pro Asn Ser Phe Ser Glu Arq Asp 
SO .85 90 

GAA TTG GAA AAA AAA CGG GGT AGT TCT GAA CTT ATT GAA TCA AAA 375 
Glu Leu Glu Lys Lys Arg Gly Ser Ser Glu Leu Xle Glu Ser Lys 
95 100 105 

TGG GAA GAT GGG CAA AGT CGT GTA* GTT GGT TAT ACA AAT TTC ACT 420 
~rp Glu Asp Gly Gin Ser Arg Val Val Gly Tyr Thr Asn Phe Thr 
110 115 120 

TAT GTC CGT TCG GGA TAT GTT TAC CTT AAT AAA AAT AAT ATT GAT 4 65 

Tyr Val Arg Ser Gly Tyr Val Tyr Leu Asn Lys Asn Asn lie Asp 
125 130 13 5 

ATT AAG AAT AAT ATA GTT CTT TTT GGA CCT GAC GGA TAT CTT TAC 510 
xle Lys Asn Asn Xle Val Leu Phe Gly Pro Asp Gly Tyr Leu Tyr 
140 145 " 150 
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TAT AAA COO AAA GAA COT TCC AAG CJO CTG CO, TCC- GAA AAC ATA 
Tvr Lvs GlV Lys Clu Pro Ser Lye Glu Leu *-ro ^ 
155 160 

S £ i£ - i5 S 25 ™ - £ ^ S K - i 

170 17b 

CAA AGO TTT GAA GGA TTG COT JOT OCA OCA OCA OCA OAT AAA TCG 
Gin Arg Phe Glu Gly Leu Gly Ser Ala Ala Gly <*xy . jr ^ 
185 19U 

5!? 12 S S Si Si X? S S 5 - SK S 

200 zur> 

GAG GCA TCA TCC GOT CAT ACC GAT TTT GOT ATG A« AGT GAG TTT 
Glu Ala Ser Ser Gly His Thr Asp Phe Gly Met xnr ^ 
215 ^ u 

GAG GTX GAT TTT TCT OAT AAA ACA ATA AAG GGC ACA CTT TAT CGT 
Glu Val Asp Phe Ser Asp Lys Thr He Lys Gly inr 240 

230 .- - 23b • 

lrT KAJi AAC AAA CAA ATA AAA 
AAC AAC CGT ATT ACT CAA *AT AAT ACT GAA. ~AC 

Asn Asn Arg He Thr Gin Asn Asn Ser Glu Asn i# ^ 
245 2bo 



ACT ACO CGT TAC ACC ATT CAA OCA ACT CTT CAC GGC AAC CGT TTC 
Thr Thr Arg Tyr Thr lie Gin Ala Trir Leu «a.s ^y ^ 
260 2fc>;a 



2S ss ss S£ s ss ss S S Si i£ ?S Si S| 

s s is I s; ss ss ssssi - - s ^ 
» s ss S si iiJ s s ?s as sj ;s ss s 

3 65 

~ n rrc aaT AAG GCG GCP. TTT CAG CAC GAG 

TCA CTG CTG CCG TCT G~G GGC AAT His Glu 

Ser Leu Leu Pro Ser Glu Gly Asn Lys hla Axa ^ 

- -380 JO:3 



555 



600 



645 



690 



735 



7 80 



B25 



870 



fCTrf - r* AT AAA GGT GCA ACA AAT GGA AGT 

AAA GGT AAG GCG TTG GCG GCA GAT AAA ger 
Lys Gly Lys Ala Leu Ala Ala Asp Lys Gly Al* xox: ^ 

290 29r> 

GGG CCG AAA GGC GAG GAA CTT GCC GGT AAA TTC TTG AGC AAC GAC 
Gly Pro Lys Gly Glu Glu Leu Ala Gly Lys Phe i.e ^ 
- 1 305 . 31U 

SS iS ?S SS X ?I? JS SJ X i| SS Si S5 - & 

320 3 " 



915 



960 



1005 



1050 



109 5 



1140 



1185 



1230 
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ATT GAG CAA AAC GOC GTG AAG GCA ACG GTG TGT TGT TCC AAC TTG 127 5 

lie Giu Gin Asn Gly Vai Lys Ala Thr Val Cvs Cys Ser Asn Leu 
395 400 " ~ 405 

GAT TAC ATG AGT TTT GGG AAG CTG TCA AAA GAA AAT AAA GAC GAT 1320 

Asp Tyr Met Ser Phe Gly Lys Leu Ser Lys Gku Asn Lys Asp Asp 
410 415 420 

ATG TTC CTG CAA GGT GTC CGC ACT CCA GTA TCC GAT GTG GCG GCA* 1365 

Met Phe Leu Gin Gly Val Arg Thr Pro Val Ser Asp Val Ala Ala * 
425 430 435 

AGG ACG GAG GCA AAC GCC AAA TAT CGC GGT ACT TGG TAC GGA TAT 1410 

Arg Thr Glu Ala Lys Tyr Arg Gly Thr Gly Thr Trp Tyr Gly Tyx 
440 " 445 450 

ATT GCC AAC GGC ACA AGC TGG AGC GGC GAA GCC TCC AAT CAG GAA 145 5 

He Ala Asn Gly Thr Ser Trp Ser Gly Glu Ala Ser Asn Gin Glu 
455 460 465 

GGT GGT AAT AGG GCA GAG TTT GAC GTG GAT TTT TCC ACT AAA AAA 1500 

Gly Gly Asn Arg Ala Glu Phe Asr> Val Ast> Phe Ser Thr Lys Lys 
470 " 475 480 

ATC AGT GGC ACA CTG ACG GCA AAA GAC CGT ACG TCT CCT GCG TTT 154 5 

He Ser Gly Thr Leu Thr Ala Lys Asp Arg Thr Ser Pro Ala £he 
485 " 490 495 

ACT ATT ACT GCC ATG ATT AAG GAC AAC GGT TTT TCA GGT GTG GCG 1590 

Thr lie Thar Ala Met Xle Lys Asp Asn Gly Phe Ser Gly Val Ala 
500 505 510 

AAA ACC GGT GAA AAC GGC TTT GCG CTG GAT CCG CAA AAT ACC GGA 1635 

Lys Thr Gly Glu Asn Gly Phe Ala Leu Asp Pro Gin Asn Thr Gly 
515 520 525 



" AAT ~ TCC "CAC TAT ACG CAT ATT GAA GCC ACT GTA TCC GGC GGT TTC 1680 

Asn Ser His Tyr Thr; His lie Glu Ala Thr Val Ser Gly Gly Phe 
530 535 540 

TAC GGC AAA AAC GCC ATC GAG ATG GGC GGA TCG TTC TCA TTT CCG 172 5 

Tyr Gly Lys Asn Ala Xle Glu Met Gly Gly Ser Phe Ser Phe Pro 
545 550 555 

GGA AAT "GCA CCA GAG GGA AAA CAA GAA AAA GCA TCG GTG GTA TTC 1770 

Gly Asn Ala Pro Glu Gly Lys Gin Glu Lys Ala Ser Val. Val Phe 
560 565 570 

GGT GCG AAA CGC CAA CAG CTT GTG CAA TAA GCACGGCT 1808 

Gly Ala Lvs Arg Gin Gin Leu Val Gin 
575 
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SKO TO NO : 2 



Objet : Sequence de l'ADN genomique de la souche de N. meningitidis IM2394 

codant pour le precurseur de la sous-unite Tbp 1 du recepteur de la transferrin 
et sequence prot6ique d6duite. Le peptide signal est indiqud en caracferes gras. 

CTTCCGATG CCGTCTGAAA GCGAAGATTA GGGAAACACT 40 

ATG CAA CAG CAA CAT TTG TTC CGA TTA AAT ATT TTA TGC CTG TCT 85 
Me- Gin Gin Gin His Leu Pbe Arg Leu Asn lie Leu Cys Leu Ser 
-24 -20 -15 -10 

TTA ATG ACC GCG CTG CCC GTT TAT GCA GAA AAT GTG CAA GCC GAA 130 
Leu Met Tnr Ala Leu Pro Val Tyr Ala Glu Asn Val Gin Ala Glu 
-5 -11 5 

CAA GCA CAG GAA AAA CAG TTG GAT ACC ATA CAG GTA AAA GCC AAA 
Gin Ala Gin Glu Lys Gin Leu Asp Thr He Gin Val Lys Ala Lys 
lO 15 20 



AAA CAG AAA ACC CGC CGC GAT AAC GAA GTA ACC GGG CTG GGC AAG 
Lys Gin Lys Thr Arg Arg Asp Asn Glu Val Thr Gly Leu Gly Lys 



25 



TTG GTC AAG TCT TCC GAT ACG CTA AGT AAA GAA CAG GTT TTG AAT 
Leu Val Lvs Ser Ser Asr> Thr Leu Ser Lys Glu Gin Val Leu Asn 
40 45 50 



ATC CGA GAC CTG ACC CGT TAT GAT CCG GGT ATT uuu ox^ ox^ v,r^ 
He Arg Astd Leu Thr Arg Tyr Asp Pro Gly He Ala Val Val Glu 

*_ 55 ; 60 65_...._ 

CAG GGT CGG GGC GCA AGT TCC GGC TAT TCA ATA CGC GGC ATG GAT 
Gin Gly Arg Gly Ala Ser Ser Gly Tyr Ser He Arg Gly Met Asp 
~~ 75 80 



AAA AAC CGC GTT TCC TTA ACG GTA GAC GGC GTT TCG CAA ATA CAG 
Lys Asn Arg Val Ser Leu Thr Val Asp Gly Val Ser Gin He Gin 
J 90 ^5 



85 



TCC TAC ACC GCG CAG GCG GCA TTG GGT GGG ACG AGG ACG .GCG GGT 
Se- Tyr Thr Ala Gin Ala Ala Leu Gly Gly Thr Arg Thr Ala Gly 
105 11° 



100 



AGC AGC GGC GCA ATC AAT GAA ATC GAG TAT GAA AAC GTC AAG GCC 
Ser Ser Gly Ala He Asn Glu He Glu Tyr Glu Asn Val Lys Ala 
120 125 



115 



GTT GAA ATC AGC AAG GGT TCG AAT TCA TCA GAA TAC GGA AAC GGC 
Val Glu He Ser Lvs Gly Ser Asn Ser Ser Glu Tyr Gly Asn Gly 
, - 135 140 



130 



175 



220 



265 



ATC CGA GAC CTG ACC CGT TAT GAT CCG GGT ATT GCC GTG GTC GAA 310 
^eu 
55 



355 



400 



44 5 



490 



535 



GCA TTG GCA GGT TCG GTC GCA TTT CAA ACC AAA ACC GCA GCC GAC 580 
Ala Leu Ala Gly Ser Val Ala Phe Gin Thr Lys Thr Ala Ala Asp 

150 155 



145 
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ATT 
He 



TAT 
Tyr 

GGA 
Gly 

CGG 
Arg 



CAG 
Gin 



ATC GGA 
lie Gly 

TCG GGA 
Ser Gly 

CGC AGC 
Arg Ser 

GGT CGG 
Gly Arg 



AGC TTC 
Ser Phe 



GGC 
Gly 

GGA 
Gly 



AAA 
Lys 



AAC 
Asn 



AGT CAG 
Ser Gin 



TAT GCG 
Tyr Ala 

GAT GAG 
Asp Glu 

CGC TTA 
Arg Leu 



GAG GGA 
Glu Gly 
160 

AAA GAC 
Lys Asp 
175 

GGC GGC 
Gly Gly 
190 

GAA ATC 
Glu lie 
205 

AAC CGG 
Asn Arg 
220 

TAC AGA 
Tyr Arg 
235 

GCC TGT 
Ala Cys 
250 

CGC AAA 
Arg Lys 
265 

CTT GCG 
Leu Ala 
280 



AAA CAG TGG 
Lys Gin Trp 



CAT GCC CTG 
Hie Ala Leu 



GCG GAA GCC 
Ala Glu Ala 



CAT GCG CAT 
His Ala His 



CTG GTG TTG 
Leu Val Leu 



TAT TTC ATT 
Tyr Phe lie 



AAA AAC AAG 
Lys Asn Lys 



ACC GTC AGC 
Thr Val Ser 



AAC CCG CTT 
Asn Pro Leu 



GGC ATT 
Glv lie 
165 

ACG CAA 
Thr Gin 
180 

CTC CTT 
Leu Leu 

195 

AAA GAT 
I,ys Asp 
210 

GAC GAG 
Asr> Glu 
225 

GTC GAA 
Val Glu 
240 

CTG AAA 
Leu Lys 
255 

ACG CAG 
Thr Gin 
270 

GAG TAT 
Glu Tyr 
285 



CAG AGT 
Gin Ser 



AAA 
Lys 



TCC CTT 
Ser Leu 



ATT TAT- 
lie Tyr 



GCC GGC 
Ala Gly 



GAC AAG 
Asp Lys 



GAA GAA 
Glu Glu 



GAA GAT 
Glu Aso 



GAT TAT 
Asp Tyr 

GGC AGC 
Gly Ser 



GCG 
Ala 



ACT 
Thr 



AAG 
Lys 

AAG 
Lys 

TGC 
Cys 



GCC 
Ala 



ACC 
Thr 



CAA 
Gin 



ACT GCC 
Thr Ala 
170 

CTT GCC 
Leu Ala 
185 

AAA CGG 
Lys Arg 
200 

GGT GTG 
Gly Val 
215 

GAG GGT 
Glu Gly 
230 

CAC AAT 
His Asn 
245 

TCG GTC 
Ser Val 
260 

GGC TCC 
Gly Ser 
275 

TCA TGG 
Ser Trp 
290 



CTG 
Leu 



GCC 
Ala 



ACT 
Thr 



CTG 
Leu 



CTG 
Leu 



TTC CGA 
Phe Arg 



GTT CTC 
Val Leu 



GTT CCT 
Val Pro 



AAA GGT 
Lys Gly 



TTT GTT 
Phe Val 



GGT 
Gly 



GGG 
Gly 



ACC GGC 
Thr Gly 



GTC GAA 
Val Glu 



CCG GGT 
Pro Gly 
295 

GAA CGT 
Glu Arg 
310 

GCC TAT 
Ala Tyr 

325 

CTT GGC 
Leu Gly 
340 

CAG GGA 
Gin Gly 
355 

GTG TTT 
Val Phe 
370 

TAT GTT 
Tyr Val 
385 



TGG CAT TTG 
Trp His Leu 



ACG CAG CAG 
Thr Gin Gin 



TTT ACC AGT 
Phe Thr Ser 



AAA TAT TCG 
Lys Tyr Ser 



GAG GGC AGT 
Glu Gly Ser 



TAT GAT GAA 
Tyr Asp Glu 



TAC CAT AAT 
Tyr Kis Asn 



GAC AAC 
Asp Asn 
300 

ACC TTT 
Thr Phe 
315 

GAA GAT 
Glu Asp 

330 

GGC GAT 
Gly Asp 
345 

AC A TTG 
Thr Leu 
360 

CGC CAT 
Arc Kis 
375 

GCT GAT 
Ala Asp 
390 



CGC CAT 
Arg His 



GAT ACA 
Asr> Thr 



TAT GTA 
Tyr Val 



TAT 
Tvr 



CGG 
Arg 



CCC 
Pro 



AAT AAG 
Asn Lys 



CAG GGT 
Gin Gly 



GCA 
Ala 



ATC 
lie 



ACT AAA 
Thr Lys 

AAG GAT 
Lys Asp 



AAC 
Asn 



ACC 
Thr 



GTC GGA 
Val Gly 
305 

GAT ATG 
Asp Met 
320 

GGT TCG 
Gly Ser 
335 

GAA AGG 
Glu Arg 
350 

GGT TAC 
Gly Tyr 
365 

CGC TAC 
-Arg Tyr 
380 

TGG GCC 
Trp Ala 
395 



625 



670 



715 



760 



805 



850 



895 



940 



985 



1030 



1075 



1120 



1165 



1210 



1255 



1300 



CI 
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Art? Phe Gly Asn Asn Thr Tyr Thr Asp Cys Thr Pro Arg Asn lie 
535 540 545 

GGC GGC AAC GGT TAT TAT GCA GCC GTT CAA GAC AAT GTC CGT TTG 
Gly Gly Asn Gly Tyr Tyr Ala Ala. Val Gin Asp Asn Val Arg Leu 
550 555 560 

GGC AGG TGG GCG GAT GTC GGA GCA GGC ATA CGT TAC GAT TAC CGC 
Gly Axg. Trp Ala. Asp Val Gly Ala. Gly He Arg Tyr Asp Tyr Arg 
1 565 570 575 

AGC ACG.CAT TCG GAA GAT AAG AGT GTC TCT ACC GGC ACT CAC CGC 
Ser Thr His Ser Glu Asp Lys Ser Val Ser Thr Gly Thr H^s Arg 
580 58S . 590 

AAC CTT TCT TGG AAC GCG GGC GTA GTC CTC AAA CCT TTC ACC TGG 
Asn Leu Ser Trp Asn Ala Gly Val Val Leu Lys Pro Phe Thr Trp 
595 600 605 

ATG GAT TTG ACT TAT CGC GCT TCT ACG GGC TTC CGT CTG CCG TCG 
Met Asr> Leu Thr Tyr Arg Ala Ser Thr Gly Phe teg Leu Pro ser 
610 615 620 

-TTT GCC GAA ATG TAT GGC TGG AGA GCC GGG GAG TCT TTG AAA ACG 
Phe Ala Glu Met Tyr Gly Trp Arg Ala Gly _Glu Ser Leu Lys Thr 
625 630 635 



1345 



1390 



1435 



1480 



1525 



GAT TAC GCC CGA CTT TCT TAT GAC CGC- CAA GGT ATA GAT TTG GAC 
Aso Tyr Ala Axg Leu Ser Tyr Asp Arg Gin Gly He Asp Leu Asp 
" 400 • 405 410 

AAC CGT TG CAG CAG ACG CAT TGC TCT CAC GAC GGT TCG GAT AAA 
Asn Axg Leu Gin Gin Thr His Cys Ser His Asp Gly Ser Asp Lys 
415 420 

AAT TGC CGT CCC GAC GGC AAT AAA CCG TAT TCT TTC TAT AAA TCC 
Asn cys Arg Pro Asp Gly Asn Lys Pro Tyr Ser Phe Tyr Lys Ser 
430 435 ** u 

GAC CCG ATG ATT TAT GAA GAA "AGC CGA AAC CTG TTC CAA GCA GTA 
Asp Arg Het He Tyr Glu Glu Ser Arg Asn Leu Phe Gin Ala Val 
445 450 4 " 

TTT AAA AAG GCA TTT GAT ACG GCC AAA ATC CGT CAC AAT TTG AGT 
Phe Lvs Lys Ala Phe Asp Thr Ala Lys He Arg hiB Asn Leu Ser 
460 465 

ATC AAT CTA GGG TAC GAC CGC TTT AAG TCG CAA TTG TCC CAC AGC 1570 
He Asn Leu Gly Tyr Asp Axg Phe Lys Ser Gin Leu Ser Hxs Ser 
475 48.O0 4Bb 

GAT TAT TAT CTT CAA AAC GCA GTT CAG GCA TAT GAT TTG ATA ACC 1615 
Asp Tyr Tyr Leu Gin Asn Ala Val Gin Ala Tyr Asp Leu lie Thr 
490 495 500 

CCG AAA AAG CCT CCG TTT CCC AAC GGA AGC AAA GAC AAC CCG TAT 
Pro Lys Lys Pro Pro Phe Pro Asn Gly Ser Lys Asp Asn Pro Tyr 
505 510 

AGG GTG TCT ATC GGC AAG ACC ACG GTC AAT ACA TCG CCG ATA TGC 
Arg Val Ser He Gly Lys Thr Thr Val Asn Thr Ser. Pro lie Cys 
520 525 530 

— GGT- -TTG-- GGG— AAT--AAG - ACC— TAT--ACA~GAC-_TGC__ACA — CCG__AGS_AAT_A ; T w C 



1660 



1705 



1750 



1795 



1840 



1885 



1930 



1975 



2020 



" '» 1 < III! 1 ' W! 
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GGC GGC AAC GGT TAT TAT GCA GCC GTT CAA GAC AAT GTC CGT TTG 1795 
Gly Giy Asn Glv Tvr Tyr Ala Ala Val Gin Asp Asn Val Arg Leu 
550 " 555 560 

GGC AGG TGG GCG GAT - GTC GGA GCA GGC ATA CGT TAC GAT TAC CGC 1840 
Glv Ara Trp Ala Asd Val Gly Ala Gly lie Arg Tyr Asp Tyr Arg 
565 570 575 

AGC ACG CAT TCG GAA GAT AAG AGT GTC TCT ACC GGC ACT CAC CGC 188 5 

Ser Thr His Ser Glu Asp Lys Ser Val Ser Thr Gly Thr His Arg 
580 585 590 

AAC CTT TCT TGG AAC GCG GGC GTA GTC CTC AAA CCT TTC ACC TGG 1930 
Asn Leu Ser Trp Asn Ala Gly Val Val Leu Lys Pro Phe Thr Trp 
595 600 605 

ATG GAT TTG ACT TAT CGC GCT TCT ACG GGC TTC CGT CTG CCG TCG 1975 
Met Asp Leu Thr Tyr Arg Ala Ser Thr Gly Phe Arg Leu Pro Ser 
610 615 620 

TTT GCC GAA ATG TAT GGC TGG AG A GCC GGG GAG TCT TTG AAA ACG 2020 
Phe Ala Glu Met Tyr Gly Trx> Arg Ala Gly Glu Ser Leu Lys Thr 
625 630 635 

TTG GAT CTG AAA CCG GAA AAA TCC TTT AAT AG A GAG GCA GGT ATT 206 5 

Leu Asr> Leu Lys Pro Glu Lys Ser Phe Asn Arg Glu Ala Gly lie 
640 645 650 

GTA TTT AAA GGG GAC TTC GGC AAT TTG GAA GCC AGC TAT TTC AAC 2110 
Val Phe Lys Gly Asd Phe Gly Asn Leu Glu Ala Ser Tyr Phe Asn 
655 " 660 665 

AAT GCC TAT CGC GAC CTG ATT GCA TTC GGT TAT GAA ACC CGA ACT 215 5 

Asn Ala Tyr Arc Asp Leu lie Ala Phe Gly Tyr Glu Thr Arg Thr 

67 0 _ 67S 6B0 

CAA AAC GGG CAA ACT TCG GCT TCT GGC GAC CCC GGA TAC CGA AAT 2200 
Gin Asn Gly Gin Thr Ser Ala Ser Gly Asp Pro Gly Tyr Arg Asn 
685 690 695 

GCC CAA AAT GCA CGG ATA GCC GGT ATC AAT ATT TTG GGT AAA ATC 224 5 

Ala Gin Asn Ala Axg lie Ala Gly lie Asn lie Leu Gly Lys lie 
700 705 710 

GAT TGG CAC GGC GTA TGG GGC GGG TTG CCG GAC GGG TTG TAT TCC 2290 
Asp Trp His Gly Val Trp Glv Gly Leu Pro Asp Gly Leu Tyr Ser 
715 " 720 725 

ACG CTT GCC TAT AAC CGT ATC AAG GTC AAA GAT GCC GAT ATA CGC 2335 
Thr Leu Ala Tyr Asn Arg lie Lys Val Lys Asp Ala Asp lie Arg 
730 735 * 740 

GCC GAC AGG ACG TTT GTA ACT TCA TAT CTC TTT GAT GCC GTC CAA 2380 
Ala Aso Arg Thr Phe Val Thr Ser Tyr Leu Phe Asp Ala Val Gin 
745 *?50 755 

CCT TCA CGA TAT GTA TTG GGT TTG GGT TAC GAC CAT "CCT "GAC GGA 2425 
Pro Ser Arg Tyr Val Leu Gly Leu Gly Tyr Asp His Pro Asp Gly 
760 765 770 

ATA TGG GGC ATC AAT ACG ATG TTT ACT TAT TC_C AAG. GCA AAA . TCT 2470 
lie Trp Gly lie Asn Thr Met Phe Thr Tyr Ser Lys Ala Lys Ser 
775 780 785 
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ACA TTT AGC TTG GAA ATG AAG TTT TAA ACGTCCAAAC GCCGCAAATG 
Thr Phe Ser Leu Giu Met Lys Phe 
880 

CCGTCTGAAA GGCT 



2787 



2801 



/1<Z\ _ 

* 2692532 
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qpd TP NO : 3 

rihiPt • Seouencs de l'ADN genomique de la souche cie M meningitidis IM2169 

° bj6t * S^rlcp^rsLrdeUsous-unitdTbpl et sequence protege oeauitc 

Le peptide signal est indique en caracteres gras. 

ATCAAGAATA AGGCTTCAGA 20 
CGGCATCGCT CCTTCCG ATA CCGT CTG AAA GCGAAGATTA GGGAAACATT 70 

ATG CAA CAG CAA CAT TTG TTC CGA TTA AAT ATT TTA TGC CTG TOG 
JieT Gin Gin Gin His Leu Phe Axg Leu Asn He Leu Cys _ 
-24 -20 _15 



2S if, S S? S K £ S SiSS ?5 Si S SO 

CAA CCA CAG GAA AAA CAG TTG GAT ACC ATA CAG GTA AAA GCC AAA 
Sn Ala Gin Glu Lys Gin Leu Asp Thr He Gin Val Lys Ala Lys 
10 15 

AAA CAG AAA ACC CGC CGC GAT AAC GAA GTA ACC GGT CTG GGC AAA 

Lys Gin Lys Thr Arg Arg Asp Asn Glu Val 1'nr oxy ^ 



25 



TTG GTC AAA ACC GCC GAC ACC CTC AGC AAG GAA CAG GTA CTC GAT 
Leu Val Lys Thr Ala Asp Thr Leu Ser i.ys Glu Gin Va. Leu Asp 



40 45 



ATC CGC GAC CTG ACG CGT TXC GAC CCC GGC }^ ^ ^ Va5 G^u 
He Arg Asp Leu Thr Arg Tyr Asp Pro Gly He Ala vax ^_ 
55 60 

a; sj s sj s s s ss sf s s ss ss s 2s 

so ss 2S 52 S S - 51? 2| ss s s si s ss 

s ?o? s ss ss ts si is s; s? s s ss s ss 

1O0 105 • LJ - U 

S£ K SS Ei i2 Si S5 Si £ Si iin 5S §i S 

120 - LX = 



115 



GTC GAA ATC AGC AAA GGC TCA AAC TCG GTC GAA CAA GGC AGC GGC 
Val -Glu He Ser- Lys Gly Ser Asa -Ser Val Glu Gin Gly Ser y 



115 



160 



205 



250 



295 



..340_.. 



385 



430 



475 



520 



565 



130 
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CCA «0 =CC CCT TCC «C CC* TXT C f JCC *» «= CCC «C «. 
> ia i.eu Ala Gly Ser Vax Ala Phe Gin .yr uy , 55 

145 1:>0 
GTT ATC GCC GAA GGC ACG GAG TGC CGC ATX CAG JCT AAA ACC CCC 
Val He Gly Glu Gly Arc Gin xrp Gly ne Gin :> ^ 

160 165 

SS 2S S S SJ S SS S K 2 S SS £ 5 S 

190 ' i " ;> 

si s-ss - s m S Si SS S5 K SS s s !S 

205 

CAG ACC XXX AAC AGG CXG GTG COG GTT GAA GAC JCC ACC GAA XAC 
Gin Ser Phe. Asn Arg i-eu Val va - v,x . -230 

220 ^ s 

CCC TAX' XXC AXC GXX GAA GAT GAA TGC GAA GGC AAA AAT XAC GAA 

Ala Tvr Phe Tie Val Glu Asp Glu Cys Glu Gxy u Y ^ 
235 2ftu 

„.„ rTT qtC GGC AAA GAC GAA 

ACG TGX AAA AGC AAA CCG AAA AAA GAT GXX GXC ^ 
Thr Cys Lys Ser Lys Pro Lys Lys ASp vax j ^ 

CGX CAA ACG GTT TCC ACC CCA GAC TAC ACG GGC CCC_ AAC CGC TTC 
Arg Gin Thr Val Ser Thr Arg Asp Tyr Thr oxy ^ 

CTC GCC OAT CCC CIT XCA ^^^^^f^^S 
Leu Ala Asp Pro Leu Ser Tyr Glu Ser Arg Ser xrp ^ 
280 285 

rrr r .AC TAC ATC GGC GGC ATA 

ss ss ?r. s ss ss s: i ss ^ - °« - 

2S 5 - SK S S S S S5 - ?1 ~, 

310 • 3iD 

nrr GTT TXX GAT GCA AAT TCA AAA CAG 

s ss s s is "° ss s. -p — «' ss "° 

CCC CCT TCT TTC CCC CCC £= CCC TAC CCC CCC £C CJC »K 

Ala Gly Ser Leu Pro Gly Asn Gly x,ys xyr a* j ^ 

340 J ^ • 

TAC GGC GGA CTG TXT ACC AAC GGC CAA AAC GGT CCG CXG GTG JJC 
Tyr Gly Gly Leu Phe Thr Asn Gly Glu Asn Gly ^ 

355 JbU 

~ ,rr rrr GTG TT T TAC GAC GAG ACG CAC.ACC AAA 
GCG GAA TAC GGT ACG GGC GTG TT T£ Thr Lys 

Ala Glu Tyr Gly Thr Gly Val Phe Tyr Asp ^ 
370 ^'^ 



600 



645 



690 



735 



780 



825 



870 



915 



960 



TOO 5 



1050 



109 



1140 



1185 



12 



12 
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AGC CGC TAC GGT TTG GAA TAT GTC TAT ACC AAT GCC GAT AAA GAC 1320 
Ser Arg Tyr Giy Leu Giu Tyr Val Tyr Thr Asn Ala Asp Lys Asp 
385 390 395 

ACT TGG GCG GAT TAT* GCC CGC CTC TCT TAC GAC CGG CAG GGC ATC 1365 
Thr- Trp Ala Asp Tyr Ala Arg Leu Ser Tyr Asp Arg Gin Gly lie 
400 " 405 410 

GGT TTG GAC AAT CAT TTT CAG CAG ACG CAC TGT TCT GCC GAC GGT 1410 
Gly Leu Asp Asn His Phe Gin Gin Thr His Cys Ser Ala Asp Gly 
415 420 425 

TCG GAC AAA TAT TGC CGC CCG AGT GCC GAC AAG CCG TTT TCC TAT 1455 
Ser Asp Lys Tyr Cys Arg Pro Ser Ala Asp Lys Pro Phe Ser Tyr 
430 435 440 

TAC AAA TCC GAC CGC GTG ATT TAC GGG GAA AGC CAC AGG CTC TTG 1500 
Tyr Lys Ser Asr> Arc Val lie Tyr Gly Glu Ser Hie Arg Leu Leu 
445 ' 450 455 

CAG GCG GCA. TTC AAA AAA TCC TTC GAT ACC GCC AAA ATC CGC CAC .154 5 

Gin Ala Ala Phe Lvs Lvs Ser Phe Asp Thr Ala Lys Xle Arg His 
460 " " 465 " 470. 

AAC CTG AGC GTG AAT CTC GGG TTT GAC CGC TTT GAC TCT AAT CTC 1590 
Asn Leu Ser Val Asn Leu Gly Phe Asp Arg Phe Asp Ser Asn Leu 
475 "* 480 485 

CGC CAT CAG GAT TAT TAT TAT CAA CAT GCC AAC CGC GCC TAT TCG 163 5 

Arg His Gin Aso Tyr Tyr Tyr Gin His Ala Asn Arg Ala Tyr Ser 
490 495 500 

TCG AAA ACG CCC CCT AAA ACC GCC AAC CCC AAC GGC GAC AAG AGC 1680 
Ser Lys Thr Pro Pro Lys Thr Ala Asn Pro Asn Gly Asp Lys Ser 

__ _ 5 05. 5 JlO 1 _5 JL 5 

AAA CCC TAT TGG GTC AGC ATA GGC GGG GGA AAT GTG GTT ACG GGG 1725 
Lys Pro Tyr Trx> Val Ser lie Gly Gly Gly Asn Val Val Thr Gly 

520 525 530 

CAA ATC TGC CTC TTT GGC AAC AAT ACT TAT ACG GAC TGC ACG CCG 1770 
Gin lie Cys Leu Phe Gly Asn Asn Thr Tyr Thr Asp Cys Thr Pro 
535 540 " 545 

CGC AGC ATC AAC GGC AAA AGC TAT TAC GCG GCA GTT CGG GAC AAT 1815 
Arg Ser Xle Asn Gly Lys Ser Tyr Tyr Ala Ala Val Arg Asp Asn 

550 555 560 

GTC CGT TTG GGC AGG TGG GCG GAT GTC GGC GCG GGG TTG CGC TAC 1860 
Val Arg Leu Glv Arg Trp Ala Asp Val Gly Ala Gly Leu Arg Tyr 
565 ' - 570 575 

GAC TAC CGC AGC ACG CAT TCG GAC GAC GGC AGC GTT TCC ACC GGC 1905 
Asp Tyr Arg Ser Thr His Ser Asp Astd Gly Ser Val Ser Thr Gly 

580 585 590 

ACG CAC CGC ACC CTG TCC TGG - AAC - GCC GGC ATC GTC CTC AAA CCT 1950 
Thr His Arg Thr Leu Ser Trp Asn Ala Gly lie Val Leu Lys Pro 
595 600 605 " 

GCC GAC TGG CTG GAT TTG ACT TAC CGC ACT TCA ACC GGC TTC CGC 199 5 

Ala Asp Trp Leu Asp Leu Thr" Tyr Arg Thr Ser Thr Gly Phe Arg 
610 615 620 



V 
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.SFD ID NO : 4 



nwrt • Sequence de l'ADN genomique de la souche de N. meningitidis IM2169 
° bj 6 ■ pour le precursor de la sous-unite Tbp2 et sequence prot&que dedutte. 

Le peptide signal est indique en caractere gras. 



ATTTGTTAA AAATAAATAA AATAATAATC CTTATCATTC TTTAATTGAA TTCGGTTTAT 
ttt GTA AAT CAG OCT GCT ATG GTG CTG CCT GTG 

K"2 «■> «• i:i v " 1 "* 



-20 



-15 



s s° s s s: ss sn s? ss £ - ss s 

-5 "I 1 5 . 

GAT TCT GTC GAT ACC GAA CCC CCG CGT CCC CCC CCA AAG TAT CAA 
Asp ser Val Asp Thr Glu Ala Pro Arg Pro Ala Pro i.y y ^ 

GAT GTT TCT TCC GAA AAA CCG CAA GCC CAA AAA CAC CAA GGC GCA 
Asp Val Ser Ser Glu Lys Pro Gin Al~ Gin Lys Asp y * 

TAC GGT TTT GCG ATG AGG TTG AAA CGG AGG AAT TGG TAT CCG CCC 
Tyr Gly Phe Ala, Met Arg Leu Lys Arg Arg Asn Trp Ty„ Pro Cxy 
J 45 SO 

GCA GAA GAA ACC GAG GTT AAA CTG AAC GAG AGT GAT TGG GAG GCG 

—Ala -Ciu -G-lu -Ser-Glu -Val -iyA-ieuasJi_Sitt._Ser_AfE . _ 

60 55 

£ ss s S !S - s £ S! ss s s; 5 - Si 

TCG OXT «T MX OT. C£ *=* «0 «C JJC f C CXT JT» »T 

Ser Val lie Glu Lys Val Glu Thr Asp «^£y f - 
90 95 

TCT TCC CCC TA T CTC ACA CCA TCA AAC CAT CAA AAC GGC AGC GCT 
IS ITr PrS ?Jr Leu Thr Pro Ser Asn His Gin Asn Gly Ser Ala 

105 11U 

GGC AAC GGT GTA AAT CAA CCT AAA AAT CAG GCA ACA GGT CAC GAA 
Gly Asn Gly Val Asn Gin Pro Lys Asn Gin Ala ihr Gly iu. 
120 12S 

AAT TTC CAA TAT GTT TAT TCC GGT TGG TTT TAT AAA CAT GCA CCC 
Asn Phe Gin Tyr Val Tyr Ser Gly Trp Pne J.y- y _ 

AGT GAA AAA CAT TTC AGT AAC AAA AAA ATT AAG TCA GGC CAC GAT 
Se^ Glu Lys Asp Phe Ser Asn Lys ^ys lie Lys 5e. Gly P v 

150 , 155 - - 



59 
104 

149 

194 

239 

284 

329 



374 



419 



464 



509 



554 



599 
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GGT TAT ATC TTC TAT CAC GGT GAA AAA CCT TCC CCA CAA CTT CCT 
C-lv Tvr He Phe Tyr His Gly clu Lys Pro Ser Arg Gin Leu Pro 
165 1"?0 * 

GCT TCT GGA AAA GTT ATC TAC AAA GGT GTG TGG CAT TTT GTA ACC 
Ala Ser Gly Lys Val He Tyr Lye Gly Val Trp H« Pne V~l Thr 
180 185 

GAT ACA AAA AAG GGT CAA GAT TTT CGT GAA ATT ATC CAG CCT TCA 
Asp Thr Lys Lys Gly Gin Asp Phe Arg Glu He He Gin Pro Ser 

AAA AAA CAA GGC GAC AGG TAT AGC GGA TTT TCT GGT GAT OGC ACC 
Lys Lys Gin Gly Asp Arg Tyr Ser Gly Phe Ser Gly Asp G_y ser 
210 215 

GAA GAA TAT TCC AAC AAA AAC GAA TCC ACG CTG AAA GAT GAT CAC 
gS gK £r Ser Asn Lye Asn Glu Ser Thr Lea Lys Asp Asp His 



225 



TAG GGT TAT GGT TTT ACC TCG AAT TTA GAA GTG GAT TTC GGC AAT 

££ £y xyr SS Se Thr Ser, Asn Leu Glu Val Asp- Phe Cly *.» 
240 2 " 

AAG AAA TTG ACG GGT AAA TTA ATA CGC AAT AAT GCG AGC CTA AAT 
£Js £u Thr Gly Lys Leu He Arg Asn Asn Ala Ser Leu Asn 

255 260 

AAT AAT ACT AAT AAT GAC AAA CAT ACC ACC CAA TAC TAC AGC CTT 
Ssn Thr Asn Asn Asp Lys Kis Thr Thr Gin Tyr Tyr Ser Leu 



270 



GAT GCA CAA ATA ACA GGC AAC CGC TTC AAC GGC ACG GCA ACG GCA 
Aso Ala Gin He Thr Gly Asn Arg Phe Asn Gly Thr Ala in. Axa 
285 290 

ACT GAC AAA^AAA~GAG~ AAT GAA M^ltt^^"™!*" 
T Sr 1st JyS £s Glu Asn Glu Thr Lys Leu His Pro Phe Val Ser 

300 3Ub 

r*r rrc -TCT TCT TTG AGC GGC GGC TTT TTC GGC CCG CAG GGT GAG 
S£ Sr Ser Ser Ser Gly Gly Phe Phe Gly Pro Gin Gly Glu 

315 320 

GAA TTG GGT TTC CGC TTT TTG AGC GAC GAT CAA AAA GTT GCC GTT 
£5 SS Gly Phe Arg Phe Leu Ser Asp Asp Gin Lys Val Ala Val 
330 335 

GTC GGC AGC GCG AAA ACC AAA GAC AAA CTG GAA AAT GGC GCG GCG 
Val Gly Ser Ala Lys Thr Lys Asp Lys Leu Glu Asn Gly Ala Ala 
345 - 350 

GCT TCA GGC AGC ACA GGT GCG GCA GCA TCG GGC GGT GCG GCA GGC 
Ala Ser Gly Ser Thr Gly Ala Ala Ala Ser Gly Gly Ala Ala Gly 
360 365 

ACG TCG TCT GAA AAC ACT AAG CTG ACC ACG GTT TTG GAT GCG GTT 
Thr Ser Ser Glu Asn Ser Lys Leu Thr Thr Val Leu Asp Ala Val 



375 3 80 



385 



GAA TTG ACA CTA AAC GAC AAG AAA ATC AAA AAT CTC GAC AAC TTC 
Glu Leu Thr -Leu Asn Asp Lys Lys lie LyB Aan Leu a . ^ 
390 395 



644 



689 



734 



779 



824 



869 



914 



959 



1004 



~1049 



1094 



1139 



1184 



1229 



1274 



1319 



CI 
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AGC AAT CCC GCC CAA CTG GTT GTC GAC CCC ATT ATG ATT CCG CTC 
Ser Asn Ala Ala Gin Leu Val Val As? Gly He He- -X 
405 410 



CTG CCC AAC- GAT TCC " GAA AGC GGG AAC ACT CAG GCA GAT AAA GGT 
Leu Pro Lye Asp Set Clu Ser Gly Asn Tnr Gin Ala ~sp uy ^y 
420 425 

AAA AAC GGC GGA ACA GAA TTT ACC CGC AAA TTT GAA CAC ACG CCG 
Lys Asn Gly Gly Xhr Glu Phe Thr Arg Lye Pbe Glu Hxs Thr 

J 435 440 

GAA AGT GAT ^ AM f C OCC CAA GCA GGT ACC CAG ACG AAT GGG 
Glu Ser Asp I*ys I*ys Asp Ala Gin Ala Gly xnr ^ q 
450 45b 

ss si is s s is s si s? s £ is ss £ s 

465 47 °. 

AAA ACC TAT GAA GTC GAA GTC TGC TGT TCC AAC CTC AAT TAT CTG 
Lys Thr Tyr Glu Val Glu Val Cys Cys Ser Asn Leu Asn ,yr ^ 
480 485 

AAA TAC GGA ATG TTG ACG CGC AAA AAC AGC AAG TCC ■ ""j 

Lye Tyr Gly Met Leu Thr Arg Lys Asn Ser "Lys Ser Ala He*- Gin 



495 



Gin 
505 



GCA GGA GGA AAC AGT AGT CAA GCT GAT OCT AAA ACG GAA CAA GTT 
Ala Gly Gly Aen Ser Ser Gin Ala Asp Ala Lys Thr Glu Gin ^ 



510 



Si 3! III SS E SS 25 SK 5 - XS Si Si Xj 



525 



ATT CCA ACC GAC CAA AAC GTC GTT TAT CGG GGG TCT TGG TAC GGG 
Ile 'Prd thi Xsp Glit Asn Val Val Tyr-Arg -Gly Ser- T.p 

— - — 54b 



540 



CAT ATT GCC AAC GGC ACA AGC TGG AGC GGC AAT GCT TCT GAT AAA 
Ki.B lie Ala Asn Gly Thr Ser Trp Ser Gly Asn Ala Ser Asp Lys 
555 560 

GAG GGC GGC ' AAC AGG GCG GAA TTT ACT GTG AAT TTT GCC GAT AAA 
Glu Gly Gly Asn Arg Ala Glu Phe Thr Val Asn Phe Ala Asp Lys 



570 



AAA ATT ACC GGC AAG TTA ACC GCT GAA AAC AGG CAG GCG CAA ACC 
Lys lie Thr Gly Lys Leu Thr Ala Glu Asn Axg Gin Ala Gin .nt 



585 



TTT ACC ATT GAG GGA ATG ATT CAG GGC AAC GGC TTT GAA GGT ACG 
Phe Thr He Glu Gly Met lie Gin Gly Asn Gly Phe Glu Gly Th- 



600 



GCG AAA ACT GCT GAG TCA GGT TTT GAT CTC GAT CAA AAA AAT ACC 
Ala Lys Thr Ala Glu Ser Gly Phe Asp Leu Asp Gin Lys Asn Thr 

— b ZU 



615 



,CC CGC ACG CCT AAG GCA TAT ATC ACA GAT GCC AAG GTA AAG GGC 
Thr Arg Thr Pro Lys AU Tyr He Thr Asp Ala Lys Val Ly 



L364 



1409 



1454 



1499 



1544 



1589 



1634 



1679 



1724 



1769 



1814 



1859 



19Q4 



1949 



1994 



2039 



630 
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GGT TTT TAG GGG CCT AAA GCC GAA GAG TTG GGC GGA TGG TTT GCC 2084 
Gly Phe Tyr Gly Pro Lys Ala Glu Glu Leu GXy Gly Trp Phe Ala 
645 650 655 

TAT CCG GGC GAT AAA CAA ACG GAA AAG GCA ACA GCT ACA TCC AGC 2129 
Tyr Pro Gly Asp Lye Gin Thr Glu Lys Ala Thr Ala Thr Ser Ser 
660 665 670 

GAT GGA AAT TCA GCA AGC AGC GCG ACC GTG GTA TTC GGT GCG AAA 2174 
Asp Gly Asn Ser Ala Ser Ser Ala Thr Val Val Phe Gly Ala Lye 
675 680 685 

CGC CAA CAG CCT GTG CAA TAA GCACGGTTGC CGAACAATCA AGAATAAGGC 222 5 

Arg Gin Gin Pro Val Gin 
690 

TTCAG 2230 
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Reventii catiani 

^ t #ADN seloa la revendication 1. qui comprend une 
2. Un fragment dADIN seion «. c * m1pnce d'acides amines 

sequence nucleotidique codant pour une sequence 
bomologue a celle telle que montree : 

. dans le SEQ ID NO : 1, ******* -ec le residu cysteine ~ 
1 et finissant avec le residu glutamine en position 579 , 

! - c i c SEO ID NO ^ 2, commengant avec le residu acide ^uta^qoe 

a , le SEQ ID NO • 3, commencant avec le residu acide glutamique 



ou 



1 et finissant avec le residu glutamine en position 691- 

* H-ADN selon la revendication 2, qui comprend une 
3. Un fragment d AD IS seion la j. a Hdes amines telle 

sequence nucleotidique codant pour une sequence d acmes 

que .montree : 

. d ans ,e SEQ ID NO : X. commencant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en position 579 , 

, <~n m NO • 2 commenca.it avec le ristdu acide gtatamique 

„ SEO ID NO ' 3, commencant avec le residu acide gl"<<*™-^ 

■ Tjtt « ™ - — phenylalanine en positron 88, , 



OU 
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- dans le SEQ ID NO : 4, commencant avec le residu cysteine en position 
1 et Snissant avec ie residu glutamine en position 691. 

Un fragment d'ADN selon la revendication 2, qui a une s6quence 
nucleotidique codant pour une proteine ayant une sequence d'acides 
amines homologue a celle telle que montree : 

- dans le SEQ ID NO : 1, commencant avec le residu cysteine en position 
I et Snissant avec le residu glutamine en position 579 ; 

- dans le SEQ ID NO : 2, commencant avec le residu acide glutamique 
en position 1 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commencant avec le residu acide glutamique 
en position 1 et finissant avec le residu phenylalanine en position 887 ; 
ou 

- dans le SEQ ID NO : 4, commencant avec le residu cysteine en position 
1 et fi^sanit avec 

Un fragment d'ADN selon la revendication 4 , qui a une sequence 
nucleotidique codant pour : 

i) la sous-unite Tbpl de la souche IM2394 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 2, commencant avec ie 
residu acide glutamique en position 1 et finissant avec le residu 
phenylalanine en position 884 ; 

ii) la sous-unite Tbp2 de la souche IM2394 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 1, commencant avec le 
residu cysteine en position 1 er finissant avec le residu glutamine en 
position 579 ; 

iii) la sous-unite Tbpl de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 3, commencant avec le 
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residu acide giutamique en position 1 et finissant avec le residu 
phenylalanine en position 887 ; ou 

iv) la sous-unite Tbp2 de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 4, commengant avec le 
residu cysteine en position 1 et finissant avec le residu ghitamine en 
position 691. 

Un fragment d'ADN selon la revendication 2, qui a une sequence 
nucleotidique codant pour un precurseur ayant une sequence d'acides 
amines horaologue a celle telle que montree : 

- dans le SEQ. ID NO : 1, commen^ant avec le residu methionine en 
position -20 et finissant avec le residu ghitamine en position 579 ; 

- dans le SEQ ID NO : 2, commen$ant avec le residu methionine en 
position -24 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commengant avec le residu methionine en 
position -24 et finissant avec le residu phenylalanine en position 887 ; 

- ou 

- dans le SEQ ID NO : 4, commengant avec le residu methionine en 
position -20 et finissant avec le residu ghitamine en position 691. 

Un fragment d'ADN selon L'une des revendications 1 et 2 , 
qui a une sequence nucleotidique codant pour : 

i) Le precurseur de la sous-unite Tbpl de la souche IM2394 dont la 
sequence en acides amines est montree dans le SEQ ID NO : 2, 
commengant avec le residu methionine en position -24 et finissant 
avec le residu phenylalanine en position 884 ; 

ii) Le precurseur de la sous-unite Tbp2 de la souche IM2394 dont la 
sequence en acides amines est montree dans le-SEQ ID NO : 1, 
commengant avec ie residu methionine en position -20 et finissant 
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avec le residu glutamine en position 579 ; 

iii) Le precurseur de la sous-unite Tbpl de la souche IM2169 dont la 
sequence en acides amines est montree dans le SEQ ID NO : 3, 
commen^ant avec le residu methionine en position -24 et finissant 
avec le residu phenylalanine en position 887 ; ou 

•iv) Le precurseur de la sous-unite Tbp2 de la souche IM2169 dont la 
sequence en acides amines est montree dans le SEQ ED NO : 4, 
commengant avec le residu methionine en position -20 et finissant 
avec le residu glutamine en position 691. 

8. Une cassette d' expression destinee a la production d'une proteine 
capable d'etre reconnue par un antiserum anti-recepteur de la 
transferrine de la souche de N. meningitidis IM2394 ou IM2169, qui 
comprend un fragment d'ADN selon Tune des revendications 1 a 7, place 
sous le controie des elements necessaires a son expression. 

revendication 8. 

10. Un procede de production d'une proteine capable d'etre reconnue par un 
antiserum anti-recepteur de la transferrine de la souche de N. 
meningitidis IM2394 ou IM2169, qui comprend 1'acte de cultiver une 
cellule-hote selon la revendica.tion 9 . 

11. Un bloc d'ADN isole codant pour un peptide signal ayantune sequence 
d'acides amines homologue a celle telle que montree dans : 

le SEQ ID NO : 2, commen?ant avec le residu methionine en 
position - 24 et finissant avec le residu en position - 1. 

le SEQ ID NO : 3, commengant avec le residu methionine en 
position - 24 et finissant avec le residu alanine en position - 1 ; et 

le SEQ ID NO : 4, commen^ant avec le residu methionine en 
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position - 20 et finissant avec le residu alanine en position - 1. 

12. Un bloc d'ADN isole codant pour un peptide signal ayant une sequence 
d'acides amines telle que montree dans : 

le SEQ ID NO : 2, commen$ant avec le residu methionine en 
position - 24 et finissant avec le residu en position - 1 ; 

le SEQ ID NO : 3, commengant avec le residu methionine en 
position - 24 et finissant avec le residu alanine en position - 1 ; et 

*- . le SEQ ID NO : 4, commen?ant avec le residu methionine en 
position - 20 et finissant avec le rdsidu alanine en position - 1. 
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Tbp 1-239 4 MC^KI^RiNXUrLSLXTAJlPVYAEW^ 

ibpl -21 69 MQOQKL-TRI-X ~^-CL3IJ<TAIJ?AYAJElN"VGAGOAOEKQLDT IQUKAJ<XQKT?J?.DN"EVTGLG X 

Tbpl -239 4 LVXSSDTL5XZQVI.NIRDI,TRVDPGIAVVE^ 

Tbpl -2169 LVXTADTLSKZOVXO rHDLTR^TOPGIAVVZCX^RGASSGYSIHGHDKNRVSLTVDGJL^AOIQ 

Tbp 1 - 239 4 S YTAQAA-LGGTRTAGSSG AI^^E IZTYj^NVXA VE I SXGSNSSZYGMG AZ-AG SVAJFQTXTAAD 

Tbpl - 21 69 SYTACAALGGTRTAGSSGAINEIZY3LWKAVZlSKGSN5VTOGSGAIJ^G 

Tbpl -2394 rrGZGXOVGXQSXTAYSGXDKALTOSIJU^ 

Tbpl -21 69 VIGZGRQWGIQSKTAYSGXHRGI/TQS IAl^GRIGGAIIALLIHTGRi^G£IRAHZDAGRGV 



Tbpl -2394 QS Fhmi. VXD ED KXZC^3QYR!^XVZX^CK-NGYAAC^^ 

Tbpl -21 69 QSFMRLVPVZD SSZYAYFIV^DHCZGX^irrCXSXPKXDWGKDE^QTVSTRDYTG 

Tbp 1-2394 3N?LLI^N?LZYGSQSWX.rRPGVHXDN-RHYVGAVX < 

Tbp 1-2169 PNRFHADPLSYZ3RS «T.FRPGFRPZHKRHY IGGXI^TCXJTFDTHDKTVPATI-TXAVTDA 



Tbpl -239^ " " — -GSLkgLgXY5GDNXAZRI.FVQGEC STLQG I G YGTGVF YD ERHTXNR YGVEYVYTiN 

Tbpl -21 69 NSXQAGSLPGNGKYAGNKKYGGL— NGZNGAJLVGAZ^ 

Tbpl -2394 ADKDTWADYAiU-SYDRCGXDI^NRX^THCSKDGSD^^ 

Tbpl -21 69 ADKDTVADYARI-SYDRC>3IGI^NKFTOTHCSATC 

Tbpl -2394 . RNI.FO AVFXXAJTDT AXI RHNTLS XiVUG YD RFXSOLS KSD YYI.QN AVQ A YD L ITP XXP P F P N 

Tbpl -21 69 HRI,LQAAFKXSFDTAXrRHMI.SV^^^FDPJ^DS^^^^^ 

Tbp 1-2394 GSXDNP YRVS IGXTTVNTSP ICRFGvVNTYTDCTPRNlGGNGY^AAVODtArRJLGRW'AD VGA 

Tbpl -2 1 69 GDKSKPYVVSIGGG^^VVTCQICI-FGNNTYTDCXPRSJN^ 
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YXFDAVQPSRYVT/;i.GYDKPDGIKGINTMFTXSXAi^\TO 
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FlG-.7(suil-e) 



2692592 



3/J3 

--=,2-2 394 C- CGG=3FDLD5VrTVCC^-:Sr<?:<YHDE:<50-?E:SCCDV5ZNSC^yCJAV:<I.??.?.NAHr 
Tbpl- 2^9 cE^GSraL3iv5T-^BSA?:<^VSSE:<POAOKD- AMSLXRRN--W 

~ Kr o , -.q > vpv'/-<-<v-<or C SMXtWKXLO- ?.GE?NSFSERDE — LZXXR — C- S3E-LIESXVE D 

■ibpl-2?ls -^g^^EnIs!^^^ 

, Q , G Q — s qwcrn^YVRSGYVYT^x-NNIDIXKNrva^G?DGyi-yY:<GKE?SK 

4bp2-21 69 • GSAGNGVNOPKNQATGKZSFO^SGWFYKKAASZXOrSNXXXKSGDDGY 

7Wi rr = - SEX XT v XGTWO YVTO AiKEKOSF - EG — C 3AAGGD KSG ALS ALEEGVT.RNQ AEAS 

^.^p2 _ 2 1 6 9 OLPASGKVIYXGVVrt-^VTDTXKGOOr^IIQPSXKOGSRvSGFSGDGSE^ 

- -,-,<,, SGV^rGKISETEVDrSOKTIXGTLYP.NNRI'TQNNSENKQIXTTRyTIQATI.HGNRFXGX 
?bp2-2169 DOHEGYGFT5^EVDFGNKX^GXL.IRNNAS^ 

„. n , -,-,<,, AI^^KGA-NG3-K??ISDSDSLEGGrYG?KGZHi^GKrLSNDNKVAAVFGAKO:<DK:<DG 

Tl , n , -,,<,, ^ 1 AAGPATZ TVTOAYHITGrzrXKEQIDSrGDVKKLLVDGVr 

?bp2-2169 a AA ASGST<yU^ASGGA^SSare^^ 

- ->-joy r <-t t ^^Tr,>TrCXK -QKZIE QNGVXAT ■ 

Tbpl-I?69 rp££pKDSZSGNTOADXGXNGGTE~SX?iHTPESDXXDAOAGTOTNGAQTASNTAGCTN 

- •< 

?b|2-2169 c-XTXT-HV^CCSN^Y^C^^^ 

, , Q , vSDVAAR^H^NAX^RGTWYGYIANGTSWSGSASNOEGGNRAE^DVDFSTXXISGTI.-^p 
Tbpl-1 1 69 ^§^tSc£v^G^WYGKIAN^ 

,,<,, RTS C AFT T ' r AKZXDNGFSGVAXTCENGrALDPONTGNSKYTHI - EATVSGGFYGXNAIEM 

ibb2:"l9 ^^iiG^lSNGcrGTAXTAESGcDL^XN 

T^o2-239 4 GGSFSFPGNAPEGXOE XASWFGAKRCQLVQ 

Tbo2-2159 GGVFAYPGDXQTEXATATSSDGNSASSATVVFGAXRCQPVQ 



» = acice amin6 iden c:que 
. = changemenc coaservacif 
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